Ho pubblicato una domanda “simile” in un altro thread . Ma penso che la domanda non sia abbastanza specifica / concreta per ottenere la risposta che mi aspettavo.
So che, nellanalisi di sopravvivenza, lindice di concordanza (c-index) può essere utilizzato per misurare quanto bene un ranking lelenco è relativo ai tempi di sopravvivenza dei soggetti (FE Harrell, 1996, sezione 5.5). Cioè, se i soggetti con tempi di sopravvivenza più alti ottengono punteggi più alti dal modello, il c-index del modello sarà grande.
La mia domanda è: il punteggio può essere interpretato come il rischio del soggetto? In altre parole, i soggetti con punteggi inferiori (che indicano tempi di sopravvivenza più brevi) corrispondono a un rischio di fallimento maggiore?
Commenti
- Certamente non è il uguale al rischio che vorresti per calcolare il rischio relativo tra due curve di sopravvivenza. Ma sembra evidente che la concordanza misura il modo in cui una classifica è correlata alla classifica basata sulla sopravvivenza. Quindi, se lindice di concordanza è alto per una determinata classifica, allora la classifica è buona per separare i soggetti ad alto rischio da quelli a basso rischio in base alla classifica.
- @MichaelChernick grazie ancora. Nella tua ultima frase, cosa intendi esattamente per soggetti " ad alto rischio "? Il rischio di fallimento alla fine? o il rischio di fallimento in qualsiasi momento? Ad esempio, supponiamo che il soggetto A sia classificato più in alto del soggetto B, allora sappiamo che il tempo di sopravvivenza stimato di A è più breve di B, significa anche che il rischio di fallimento di A è maggiore di B in un determinato momento T ?
Risposta
Lindice di concordanza è un indice “globale” per la convalida del predittivo capacità di un modello di sopravvivenza. È la frazione di coppie nei tuoi dati, dove losservazione con il tempo di sopravvivenza più alto ha la maggiore probabilità di sopravvivenza prevista dal tuo modello. Per quanto ricordo, equivale a una correlazione di rango.
Lindice non è calcolato per ogni osservazione / soggetto. Quindi il c-index non può essere interpretato come il rischio di un soggetto. Valori alti indicano che il tuo modello prevede maggiori probabilità di sopravvivenza per tempi di sopravvivenza osservati più elevati.
Se sei interessato al rischio di un soggetto in un periodo di tempo t, penso che devi stimare la sopravvivenza e la funzione di rischio per un dato insieme di regressori. Il mio riferimento principale su questo argomento è Harrell (2001): Rgression Modeling Strategies, Springer
Commenti
- Ha anche qualche relazione (equivalenza?) Con AUROC per la classificazione. Vedi biostat.ucsf.edu/vgsm sezione 10.1.2.
Risposta
Un rischio elevato, secondo la tua definizione, significa probabilmente avere tempi di sopravvivenza brevi.
Commenti
- OK, finalmente noi arrivare qui! Ma pensi che sia ragionevole pensare che soggetti con tempi di sopravvivenza più brevi abbiano maggiori probabilità di fallire in un determinato momento T ?
- Potresti scriverlo come un calcolo usando Bayes ' regola.