Opublikowałem „podobne” pytanie w innym wątku . Ale myślę, że to pytanie nie jest wystarczająco konkretne / konkretne, aby uzyskać odpowiedź, której się spodziewałem.
Wiem, że w analizie przeżycia indeks zgodności (indeks c) może być użyty do zmierzenia, jak dobrze ranking lista zawiera czasy przeżycia badanych (FE Harrell, 1996, sekcja 5.5). Oznacza to, że jeśli badani z wyższymi czasami przeżycia uzyskają wyższe wyniki z modelu, indeks c modelu będzie duży.
Moje pytanie brzmi: czy wynik można interpretować jako ryzyko uczestnika? Innymi słowy, czy osoby z mniejszymi wynikami (co wskazuje na krótszy czas przeżycia) odpowiadają większemu ryzyku niepowodzenia?
Komentarze
- Z pewnością nie jest to takie samo jak ryzyko, które chcesz obliczyć względne ryzyko między dwiema krzywymi przeżycia. Wydaje się jednak oczywiste, że zgodność mierzy, w jaki sposób jeden ranking jest skorelowany z rankingiem opartym na przeżyciu. Więc jeśli indeks zgodności jest wysoki dla konkretnego rankingu, ranking jest dobry w oddzielaniu osób wysokiego ryzyka od niskiego ryzyka na podstawie rangi.
- @MichaelChernick jeszcze raz dziękuję. W ostatnim zdaniu, co dokładnie masz na myśli przez " przedmioty wysokiego ryzyka "? Ryzyko ostatecznie niepowodzenia? czy ryzyko niepowodzenia w dowolnym momencie? Na przykład, załóżmy, że podmiot A ma wyższą pozycję w rankingu niż podmiot B, wtedy wiemy, że szacowany czas przeżycia A jest krótszy niż B, czy oznacza to również, że ryzyko niepowodzenia A jest większe niż B w danym momencie T ?
Odpowiedź
Indeks zgodności to „globalny” indeks służący do weryfikacji predykcyjnej zdolność modelu przetrwania. Jest to ułamek par w twoich danych, gdzie obserwacja z dłuższym czasem przeżycia ma większe prawdopodobieństwo przeżycia przewidziane przez twój model. O ile pamiętam, jest to równoważne korelacji rang.
Indeks nie jest obliczany dla każdej obserwacji / tematu. Więc c-index nie może być interpretowany jako ryzyko podmiotu. Wysokie wartości oznaczają, że model przewiduje większe prawdopodobieństwo przeżycia dla dłuższych obserwowanych czasów przeżycia.
Jeśli interesuje Cię ryzyko podmiotu w okresie t, myślę, że musisz oszacować funkcję przeżycia i hazardu dla danego zbioru regresorów. Moim głównym odniesieniem na ten temat jest Harrell (2001): Rgression Modeling Strategies, Springer
Komentarze
- Ma również pewien związek (równoważność?) Z AUROC do klasyfikacji. Zobacz biostat.ucsf.edu/vgsm sekcja 10.1.2.
Odpowiedź
Wysokie ryzyko z twojej definicji oznacza prawdopodobnie krótki czas przeżycia.
Komentarze
- OK, w końcu chodź tu! Ale czy uważasz, że rozsądne jest myślenie, że osoby o krótszych czasach przeżycia są bardziej narażone na niepowodzenie w jakimkolwiek określonym czasie T ?
- Możesz zapisać to jako obliczenie za pomocą Bayesa ' reguła.