¿Cómo interpretar la salida para calcular el índice de concordancia (índice c)?

He publicado una pregunta «similar» en otro hilo . Pero creo que esa pregunta no es lo suficientemente específica / concreta para obtener la respuesta que esperaba.

Sé que, en el análisis de supervivencia, el índice de concordancia (índice c) se puede usar para medir qué tan bien una clasificación La lista son los tiempos de supervivencia de los sujetos (FE Harrell, 1996, sección 5.5). Es decir, si los sujetos con tiempos de supervivencia más altos obtienen puntuaciones más altas del modelo, el índice c del modelo será grande.

Mi pregunta es: ¿se puede interpretar la puntuación como el riesgo del sujeto? En otras palabras, ¿los sujetos con puntuaciones más pequeñas (lo que indica tiempos de supervivencia más cortos) corresponden a un mayor riesgo de falla?

Comentarios

  • Ciertamente no es el mismo que el riesgo que tendría para calcular el riesgo relativo entre dos curvas de supervivencia. Pero parece evidente que la concordancia mide cómo una clasificación se correlaciona con la clasificación basada en la supervivencia. Entonces, si el índice de concordancia es alto para una clasificación en particular, entonces la clasificación es buena para separar a los sujetos de alto riesgo de los de bajo riesgo según el rango.
  • @MichaelChernick, gracias nuevamente. En su última oración, ¿qué quiere decir exactamente con " sujetos de alto riesgo "? ¿El riesgo de fracasar eventualmente? o el riesgo de fallar en cualquier momento? Por ejemplo, supongamos que el sujeto A tiene una clasificación más alta que el sujeto B, entonces sabemos que el tiempo de supervivencia estimado de A es más corto que B, ¿también significa que el riesgo de falla de A es mayor que B en cualquier momento en particular? T ?

Respuesta

El índice de concordancia es un índice «global» para validar el predictivo capacidad de un modelo de supervivencia. Es la fracción de pares en sus datos, donde la observación con el mayor tiempo de supervivencia tiene la mayor probabilidad de supervivencia predicha por su modelo. Por lo que recuerdo, equivale a una correlación de rango.

El índice no se calcula para cada observación / sujeto. Por tanto, el índice c no se puede interpretar como el riesgo de un sujeto. Los valores altos significan que su modelo predice mayores probabilidades de supervivencia para mayores tiempos de supervivencia observados.

Si está interesado en el riesgo de un sujeto en un período de tiempo t, creo que debe estimar la función de supervivencia y riesgo para un conjunto dado de regresores. Mi principal referencia sobre este tema es Harrell (2001): Estrategias de modelado de regresión, Springer

Comentarios

  • También tiene alguna relación (¿equivalencia?) Con AUROC para clasificación. Consulte la sección 10.1.2 de la biostat.ucsf.edu/vgsm .

Respuesta

Alto riesgo según su definición significa que es probable que tenga tiempos de supervivencia cortos.

Comentarios

  • De acuerdo, finalmente ¡Llegar aquí! Pero, ¿cree que es razonable pensar que los sujetos con tiempos de supervivencia más cortos tienen más probabilidades de fallar en cualquier momento en particular T ?
  • Podría escribirlo como un cálculo usando Bayes ' regla.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *