Jeg har lagt ut et «lignende» spørsmål i en annen tråd . Men jeg tror det spørsmålet ikke er spesifikt / konkret nok til å få svaret jeg forventet.
Jeg vet at, i overlevelsesanalyse, kan konkordansindeksen (c-indeks) brukes til å måle hvor godt en rangering listen er overlevelsestider for forsøkspersoner (FE Harrell, 1996, avsnitt 5.5). Det vil si at hvis fag med høyere overlevelsestider får høyere poengsum fra modellen, vil c-indeksen til modellen være stor.
Spørsmålet mitt er: kan poengsummen tolkes som risikoen for motivet? Med andre ord, tilsvarer fag med mindre poengsum (som indikerer kortere overlevelsestider) større sviktrisiko?
Kommentarer
- Det er absolutt ikke samme som risikoen du ønsker å beregne relativ risiko mellom to overlevelseskurver. Men det virker tilsynelatende at samstemmigheten måler hvordan en rangering er korrelert med rangering basert på overlevelse. Så hvis samstemmingsindeksen er høy for en bestemt rangering, så er rangeringen god til å skille høyrisikofagene fra lavrisiko basert på rang.
- @MichaelChernick takk igjen. I din siste setning, hva mener du nøyaktig med " høy risiko " fag? Risikoen for svikt etter hvert? eller risikoen for feil når som helst? Anta for eksempel at emne A er rangert høyere enn emne B, vi vet da at den estimerte overlevelsestiden til A er kortere enn B, betyr det også at sviktrisikoen for A er større enn B til enhver tid T ?
Svar
Overensstemmelsesindeksen er en «global» indeks for validering av prediktiv evnen til en overlevelsesmodell. Det er brøkdelen av parene i dataene dine, hvor observasjonen med høyere overlevelsestid har større sannsynlighet for overlevelse forutsagt av modellen din. Så vidt jeg husker det tilsvarer det en rangkorrelasjon.
Indeksen er ikke beregnet for hver observasjon / subjekt. Så c-indeksen kan ikke tolkes som risikoen for et emne. Høye verdier betyr at modellen din spår høyere sannsynlighet for overlevelse for høyere observerte overlevelsestider.
Hvis du er interessert i risikoen for et motiv i en tidsperiode t, tror jeg du må estimere overlevelses- og farefunksjonen for et gitt sett med regressorer. Min viktigste referanse om dette emnet er Harrell (2001): Rgression Modeling Strategies, Springer
Kommentarer
- Det bærer også noe forhold (ekvivalens?) Til AUROC for klassifisering. Se biostat.ucsf.edu/vgsm avsnitt 10.1.2.
Svar
Høy risiko etter definisjonen din betyr sannsynligvis korte overlevelsestider.
Kommentarer
- OK, til slutt kom hit! Men synes du det er rimelig å tro at personer med kortere overlevelsestider er mer sannsynlig å mislykkes når som helst T ?
- Du kan skrive det som en beregning ved hjelp av Bayes ' regel.