Jak interpretować dane wyjściowe do obliczania wskaźnika zgodności (indeks c)?

Opublikowałem „podobne” pytanie w innym wątku . Ale myślę, że to pytanie nie jest wystarczająco konkretne / konkretne, aby uzyskać odpowiedź, której się spodziewałem.

Wiem, że w analizie przeżycia indeks zgodności (indeks c) może być użyty do zmierzenia, jak dobrze ranking lista zawiera czasy przeżycia badanych (FE Harrell, 1996, sekcja 5.5). Oznacza to, że jeśli badani z wyższymi czasami przeżycia uzyskają wyższe wyniki z modelu, indeks c modelu będzie duży.

Moje pytanie brzmi: czy wynik można interpretować jako ryzyko uczestnika? Innymi słowy, czy osoby z mniejszymi wynikami (co wskazuje na krótszy czas przeżycia) odpowiadają większemu ryzyku niepowodzenia?

Komentarze

  • Z pewnością nie jest to takie samo jak ryzyko, które chcesz obliczyć względne ryzyko między dwiema krzywymi przeżycia. Wydaje się jednak oczywiste, że zgodność mierzy, w jaki sposób jeden ranking jest skorelowany z rankingiem opartym na przeżyciu. Więc jeśli indeks zgodności jest wysoki dla konkretnego rankingu, ranking jest dobry w oddzielaniu osób wysokiego ryzyka od niskiego ryzyka na podstawie rangi.
  • @MichaelChernick jeszcze raz dziękuję. W ostatnim zdaniu, co dokładnie masz na myśli przez " przedmioty wysokiego ryzyka "? Ryzyko ostatecznie niepowodzenia? czy ryzyko niepowodzenia w dowolnym momencie? Na przykład, załóżmy, że podmiot A ma wyższą pozycję w rankingu niż podmiot B, wtedy wiemy, że szacowany czas przeżycia A jest krótszy niż B, czy oznacza to również, że ryzyko niepowodzenia A jest większe niż B w danym momencie T ?

Odpowiedź

Indeks zgodności to „globalny” indeks służący do weryfikacji predykcyjnej zdolność modelu przetrwania. Jest to ułamek par w twoich danych, gdzie obserwacja z dłuższym czasem przeżycia ma większe prawdopodobieństwo przeżycia przewidziane przez twój model. O ile pamiętam, jest to równoważne korelacji rang.

Indeks nie jest obliczany dla każdej obserwacji / tematu. Więc c-index nie może być interpretowany jako ryzyko podmiotu. Wysokie wartości oznaczają, że model przewiduje większe prawdopodobieństwo przeżycia dla dłuższych obserwowanych czasów przeżycia.

Jeśli interesuje Cię ryzyko podmiotu w okresie t, myślę, że musisz oszacować funkcję przeżycia i hazardu dla danego zbioru regresorów. Moim głównym odniesieniem na ten temat jest Harrell (2001): Rgression Modeling Strategies, Springer

Komentarze

  • Ma również pewien związek (równoważność?) Z AUROC do klasyfikacji. Zobacz biostat.ucsf.edu/vgsm sekcja 10.1.2.

Odpowiedź

Wysokie ryzyko z twojej definicji oznacza prawdopodobnie krótki czas przeżycia.

Komentarze

  • OK, w końcu chodź tu! Ale czy uważasz, że rozsądne jest myślenie, że osoby o krótszych czasach przeżycia są bardziej narażone na niepowodzenie w jakimkolwiek określonym czasie T ?
  • Możesz zapisać to jako obliczenie za pomocą Bayesa ' reguła.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *