Hvordan skal man fortolke output til beregning af konkordansindeks (c-index)?

Jeg har sendt et “lignende” spørgsmål i en anden tråd . Men jeg tror, at spørgsmålet ikke er specifikt / konkret nok til at få det svar, jeg forventede.

Jeg ved, at i overlevelsesanalyse kan concordance index (c-index) bruges til at måle, hvor godt en placering listen er overlevelsestider for forsøgspersoner (FE Harrell, 1996, afsnit 5.5). Det vil sige, at hvis personer med højere overlevelsestider får højere score fra modellen, vil c-indekset for modellen være stort.

Mit spørgsmål er: kan partituret fortolkes som risikoen for motivet? Med andre ord svarer forsøgspersoner med mindre scoringer (som indikerer kortere overlevelsestider) større svigtrisiko?

Kommentarer

  • Det er bestemt ikke det samme som den risiko, du ønsker, at du beregner relativ risiko mellem to overlevelseskurver. Men det synes åbenlyst, at konkordansen måler, hvordan en rangordning er korreleret med rangordning baseret på overlevelse. Så hvis konkordansindekset er højt for en bestemt placering, er placeringen god til at adskille højrisikofagene fra lavrisikoen baseret på rang.
  • @MichaelChernick tak igen. Hvad mener du i din sidste sætning nøjagtigt med " emner med høj risiko "? Risikoen for fiasko i sidste ende? eller risikoen for fiasko på noget tidspunkt? Antag for eksempel, at emne A er rangeret højere end emne B, vi ved så, at den estimerede overlevelsestid for A er kortere end B, betyder det også, at fejlrisikoen for A er større end B på et bestemt tidspunkt T ?

Svar

Konkordansindekset er et “globalt” indeks til validering af den forudsigende evnen til en overlevelsesmodel. Det er den brøkdel af par i dine data, hvor observation med højere overlevelsestid har højere sandsynlighed for overlevelse forudsagt af din model. Så vidt jeg husker det svarer det til en rangkorrelation.

Indekset beregnes ikke for hver observation / emne. Så c-indekset kan ikke fortolkes som risikoen for et emne. Høje værdier betyder, at din model forudsiger højere sandsynligheder for overlevelse for højere observerede overlevelsestider.

Hvis du er interesseret i risikoen for et motiv i en tidsperiode t, tror jeg, du er nødt til at estimere overlevelses- og farefunktionen for et givet sæt regressorer. Min vigtigste reference om dette emne er Harrell (2001): Rgression Modelling Strategies, Springer

Kommentarer

  • Det har også en vis sammenhæng (ækvivalens?) Til AUROC til klassificering. Se biostat.ucsf.edu/vgsm sektion 10.1.2.

Svar

Høj risiko efter din definition betyder sandsynligvis korte overlevelsestider.

Kommentarer

  • OK, endelig vi Kom her! Men synes du det er rimeligt at tro, at forsøgspersoner med kortere overlevelsestider er mere tilbøjelige til at mislykkes på et bestemt tidspunkt T ?
  • Du kan skrive det som en beregning ved hjælp af Bayes ' regel.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *