Jak interpretovat výstup pro výpočet indexu shody (c-index)?

Zveřejnil jsem „podobnou“ otázku v jiném vlákně . Myslím si však, že tato otázka není dostatečně konkrétní / konkrétní, aby získala odpověď, kterou jsem očekával.

Vím, že v analýze přežití lze index shody (c-index) použít k měření toho, jak dobře hodnocení Seznam uvádí dobu přežití subjektů (FE Harrell, 1996, oddíl 5.5). To znamená, že pokud subjekty s vyšší dobou přežití získají z modelu vyšší skóre, bude c-index modelu velký.

Moje otázka zní: lze skóre interpretovat jako riziko subjektu? Jinými slovy, odpovídají subjekty s menším skóre (což naznačuje kratší dobu přežití) většímu riziku selhání?

Komentáře

  • Rozhodně to není stejně jako riziko byste vypočítali relativní riziko mezi dvěma křivkami přežití. Zdá se však zjevné, že shoda měří, jak je jedno pořadí korelováno s hodnocením na základě přežití. Pokud je tedy index shody vysoký pro konkrétní hodnocení, pak je hodnocení dobré při oddělení vysoce rizikových subjektů od nízkého rizika na základě hodnocení.
  • @MichaelChernick ještě jednou děkuji. Co ve vaší poslední větě myslíte přesně " vysoce rizikovými " subjekty? Riziko selhání nakonec? nebo riziko selhání kdykoli? Předpokládejme například, že subjekt A je ohodnocen výše než subjekt B, potom víme, že odhadovaná doba přežití A je kratší než B, znamená to také, že riziko selhání A je v kterémkoli konkrétním čase větší než B T ?

odpověď

Index shody je „globální“ index pro validaci prediktivního schopnost modelu přežití. Jedná se o zlomek párů ve vašich datech, kde pozorování s vyšší dobou přežití má vyšší pravděpodobnost přežití předpovězenou vaším modelem. Pokud si to pamatuji, odpovídá to korelaci pořadí.

Index se nepočítá pro každé pozorování / předmět. C-index tedy nelze interpretovat jako riziko subjektu. Vysoké hodnoty znamenají, že váš model předpovídá vyšší pravděpodobnost přežití pro vyšší pozorované doby přežití.

Pokud vás zajímá riziko subjektu v časovém období t, myslím, že musíte odhadnout funkci přežití a nebezpečí pro danou skupinu regresorů. Mým hlavním odkazem na toto téma je Harrell (2001): Strategie modelování regrese, Springer

Komentáře

  • Rovněž to nese určitý vztah (rovnocennost?) K AUROC pro klasifikaci. Viz biostat.ucsf.edu/vgsm část 10.1.2.

Odpovědět

Vysoké riziko podle vaší definice znamená, že pravděpodobně bude mít krátké doby přežití.

Komentáře

  • Dobře, konečně jsme pojď sem! Myslíte si však, že je rozumné si myslet, že subjekty s kratší dobou přežití pravděpodobněji selžou v jakémkoli konkrétním čase T ?
  • Můžete to napsat jako výpočet pomocí Bayes ' pravidlo.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *