一致指数（c-index）を計算するための出力をどのように解釈しますか？

別のスレッドに「同様の」質問を投稿しました。しかし、質問は私が期待した答えを得るのに十分具体的/具体的ではないと思います。

生存分析では、一致指数（c-index）を使用してランキングの程度を測定できることを知っていますリストは被験者の生存時間です（FE Harrell、1996、セクション5.5）。つまり、生存時間が長い被験者がモデルからより高いスコアを取得すると、モデルのc-indexが大きくなります。

私の質問は次のとおりです。 スコアは被験者のリスクとして解釈できますか？言い換えれば、スコアが小さい（生存期間が短いことを示す）被験者は、失敗のリスクが大きいことに対応しますか？

確かにそうではありません。 2つの生存曲線間の相対リスクを計算するリスクと同じです。しかし、一致は、1つのランキングが生存に基づくランキングとどのように相関しているかを測定することは明らかであるように思われます。したがって、特定のランキングの一致指数が高い場合、ランキングは、ランクに基づいてリスクの高い被験者とリスクの低い被験者を区別するのに適しています。
@MichaelChernickありがとうございます。最後の文で、"高リスク"の被験者とは正確にはどういう意味ですか？最終的に失敗するリスクは？またはいつでも失敗のリスク？たとえば、被験者Aが被験者Bよりも上位にランク付けされているとすると、Aの推定生存時間はBよりも短いことがわかります。これは、特定の時間にAの故障リスクがBよりも大きいことも意味します T ？

回答

一致のインデックスは、予測を検証するための「グローバル」インデックスです。生存モデルの能力。これは、データ内のペアの割合であり、生存時間が長い観測では、モデルによって予測される生存の確率が高くなります。私が覚えている限り、それは順位相関と同等です。

インデックスはすべての観測/被験者に対して計算されるわけではありません。したがって、c-indexは対象のリスクとして解釈することはできません。値が高いということは、観測された生存時間が長いほど、モデルが生存の確率が高くなることを予測することを意味します。

期間tの被験者のリスクに関心がある場合は、生存とハザード関数を推定する必要があると思います。与えられたリグレッサーのセットに対して。このテーマに関する私の主な参考資料は、Harrell（2001）：Rgression Modeling Strategies、Springer

これには、いくつかの関係（同等性？）もあります。分類のためのAUROC。 biostat.ucsf.edu/vgsm セクション10.1.2を参照してください。

定義上、リスクが高いということは、生存期間が短い可能性が高いことを意味します。