다른 스레드 에 “유사한”질문을 게시했습니다. 하지만 그 질문은 제가 기대 한 답을 얻을만큼 구체적이거나 구체적이지 않은 것 같습니다.
생존 분석에서 일치 지수 (c-index)를 사용하여 순위를 얼마나 잘 측정 할 수 있는지 알고 있습니다. 목록은 피험자의 wrt 생존 시간입니다 (FE Harrell, 1996, 섹션 5.5). 즉, 생존 시간이 더 높은 피험자가 모델에서 더 높은 점수를 받으면 모델의 c-index가 커집니다.
제 질문은 다음과 같습니다. 점수를 대상의 위험으로 해석 할 수 있습니까? 즉, 더 작은 점수 (생존 시간이 더 짧음을 나타냄)가 더 큰 실패 위험에 해당합니까?
댓글
- 확실히 그렇지 않습니다. 두 생존 곡선 사이의 상대적 위험을 계산할 위험과 동일합니다. 그러나 일치는 하나의 순위가 생존에 기반한 순위와 어떻게 상관되는지를 측정하는 것으로 보입니다. 따라서 특정 순위에 대한 일치 지수가 높으면 순위를 기준으로 위험도가 높은 주제와 낮은 위험을 구분하는 것이 좋습니다.
- @MichaelChernick 다시 한 번 감사드립니다. 마지막 문장에서 " 고위험 " 주제가 정확히 무엇을 의미합니까? 결국 실패의 위험은? 또는 언제든지 실패의 위험이 있습니까? 예를 들어, 피험자 A가 피험자 B보다 순위가 높다고 가정하면 A의 예상 생존 시간이 B보다 짧다는 것을 알고 있습니다. 이는 또한 A의 고장 위험이 특정 시간에 B보다 크다는 것을 의미합니까 T ?
답변
일치 색인은 예측을 검증하기위한 “전역”색인입니다. 생존 모델의 능력. 생존 시간이 더 높은 관측치가 모델에서 예측 한 생존 확률이 더 높은 데이터에서 쌍의 비율입니다. 내가 기억하는 한 순위 상관 관계와 동일합니다.
지수는 모든 관찰 / 대상에 대해 계산되지 않습니다. 따라서 c-index는 대상의 위험으로 해석 될 수 없습니다. 값이 높으면 모델이 더 높은 관찰 생존 시간에 대해 더 높은 생존 확률을 예측한다는 것을 의미합니다.
시간 기간 t에서 대상의 위험에 관심이 있다면 생존 및 위험 함수를 추정해야한다고 생각합니다. 주어진 회귀 변수 세트에 대해. 이 주제에 대한 저의 주요 참고 자료는 Harrell (2001)입니다. Rgression Modeling Strategies, Springer
Comments
- 또한 다음과 같은 관계 (동등성?) 분류를위한 AUROC. biostat.ucsf.edu/vgsm 섹션 10.1.2를 참조하십시오.
답변
정의상 위험이 높다는 것은 생존 시간이 짧다는 것을 의미합니다.
댓글
- 좋습니다. 여기로! 하지만 생존 시간이 짧은 피험자가 특정 시간 T 에 실패 할 가능성이 높다고 생각하는 것이 합리적이라고 생각하십니까?
- 베이 즈를 사용하여 계산으로 작성할 수 있습니다. ' 규칙.