Eu postei uma pergunta “semelhante” em outro tópico . Mas acho que essa questão não é específica / concreta o suficiente para obter a resposta que eu esperava.
Eu sei que, na análise de sobrevivência, o índice de concordância (índice c) pode ser usado para medir o quão bem uma classificação A lista contém os tempos de sobrevivência dos indivíduos (FE Harrell, 1996, seção 5.5). Ou seja, se os indivíduos com maior tempo de sobrevivência obtiverem pontuações mais altas do modelo, o c-index do modelo será grande.
Minha pergunta é: a pontuação pode ser interpretada como o risco do sujeito? Em outras palavras, os indivíduos com pontuações menores (o que indica tempos de sobrevivência mais curtos) correspondem a maior risco de falha?
Comentários
- Certamente não é o o mesmo que o risco que você faria para calcular o risco relativo entre duas curvas de sobrevivência. Mas parece aparente que a concordância mede como uma classificação está correlacionada com a classificação baseada na sobrevivência. Portanto, se o índice de concordância for alto para uma determinada classificação, a classificação é boa em separar os assuntos de alto risco de baixo risco com base na classificação.
- @MichaelChernick, obrigado novamente. Em sua última frase, o que você quer dizer exatamente com assuntos de " alto risco "? O risco de fracasso eventualmente? ou o risco de falha a qualquer momento? Por exemplo, suponha que o sujeito A seja classificado mais alto do que o sujeito B, então sabemos que o tempo estimado de sobrevivência de A é menor do que B, isso também significa que o risco de falha de A é maior do que B em um determinado momento T ?
Resposta
O índice de concordância é um índice “global” para validar o prognóstico capacidade de um modelo de sobrevivência. É a fração de pares em seus dados, onde a observação com o maior tempo de sobrevivência tem a maior probabilidade de sobrevivência prevista pelo seu modelo. Pelo que me lembro, é equivalente a uma correlação de classificação.
O índice não é calculado para todas as observações / assuntos. Portanto, o índice c não pode ser interpretado como o risco de um sujeito. Valores altos significam que seu modelo prevê maiores probabilidades de sobrevivência para tempos de sobrevivência mais altos observados.
Se você estiver interessado no risco de um sujeito em um período de tempo t, acho que deve estimar a sobrevivência e a função de risco para um determinado conjunto de regressores. Minha principal referência sobre este assunto é Harrell (2001): Rgression Modeling Strategies, Springer
Comentários
- Também tem alguma relação (equivalência?) Com AUROC para classificação. Consulte biostat.ucsf.edu/vgsm seção 10.1.2.
Resposta
Alto risco, por sua definição, significa probabilidade de ter tempos de sobrevivência curtos.
Comentários
- OK, finalmente nós obtenha aqui! Mas você acha que é razoável pensar que indivíduos com tempos de sobrevivência mais curtos têm maior probabilidade de falhar em qualquer momento específico T ?
- Você poderia escrever isso como um cálculo usando Bayes ' regra.