Ik heb een “soortgelijke” vraag gepost in een andere thread . Maar ik denk dat die vraag niet specifiek / concreet genoeg is om het antwoord te krijgen dat ik verwachtte.
Ik weet dat bij overlevingsanalyse de concordantie-index (c-index) kan worden gebruikt om te meten hoe goed een rangorde lijst is mbt overlevingstijden van proefpersonen (FE Harrell, 1996, paragraaf 5.5). Dat wil zeggen, als proefpersonen met hogere overlevingstijden hogere scores van het model halen, zal de c-index van het model groot zijn.
Mijn vraag is: kan de score worden geïnterpreteerd als het risico van het onderwerp? Met andere woorden, komen proefpersonen met kleinere scores (wat duidt op kortere overlevingstijden) een groter risico op falen overeen?
Opmerkingen
- Het is zeker niet de hetzelfde als het risico dat u zou hebben om het relatieve risico tussen twee overlevingscurves te berekenen. Maar het lijkt duidelijk dat de concordantie meet hoe één rangorde is gecorreleerd met rangschikking op basis van overleving. Dus als de concordantie-index hoog is voor een bepaalde rangschikking, dan is de rangschikking goed in het scheiden van de onderwerpen met een hoog risico en laag risico op basis van rang.
- @MichaelChernick nogmaals bedankt. Wat bedoel je in je laatste zin precies met " " onderwerpen? Het risico van mislukking uiteindelijk? of het risico van mislukking op elk moment? Stel dat onderwerp A hoger is gerangschikt dan onderwerp B, dan weten we dat de geschatte overlevingstijd van A korter is dan B, betekent dit ook dat het faalrisico van A op een bepaald moment groter is dan B T ?
Antwoord
De concordantie-index is een “globale” index voor het valideren van de voorspellende vermogen van een overlevingsmodel. Het is de fractie van paren in uw gegevens, waarbij de waarneming met de hogere overlevingstijd de grotere overlevingskans heeft die door uw model wordt voorspeld. Voor zover ik het me herinner, komt het overeen met een rangcorrelatie.
De index wordt niet voor elke waarneming / onderwerp berekend. De c-index kan dus niet worden geïnterpreteerd als het risico van een onderwerp. Hoge waarden betekenen dat uw model hogere overlevingskansen voorspelt voor hogere waargenomen overlevingstijden.
Als u geïnteresseerd bent in het risico van een onderwerp in een tijdsbestek, denk ik dat u de overlevings- en risicofunctie moet inschatten. voor een bepaalde set regressors. Mijn belangrijkste referentie over dit onderwerp is Harrell (2001): Rgression Modelling Strategies, Springer
Reacties
- Het heeft ook een relatie (gelijkwaardigheid?) AUROC voor classificatie. Zie biostat.ucsf.edu/vgsm sectie 10.1.2.
Antwoord
Een hoog risico betekent volgens uw definitie waarschijnlijk korte overlevingstijden.
Opmerkingen
- OK, eindelijk kom hier! Maar denk je dat het redelijk is om te denken dat proefpersonen met kortere overlevingstijden op een bepaald moment eerder falen T ?
- Je zou het als een berekening kunnen schrijven met behulp van Bayes ' regel.