Cum se interpretează ieșirea pentru calcularea indicelui de concordanță (index c)?

Am postat o întrebare „similară” în alt fir . Dar cred că această întrebare nu este suficient de specifică / concretă pentru a obține răspunsul pe care l-am așteptat.

Știu că, în analiza supraviețuirii, indicele de concordanță (indexul c) poate fi utilizat pentru a măsura cât de bine o clasare lista este timpul de supraviețuire al subiecților (FE Harrell, 1996, secțiunea 5.5). Adică, dacă subiecții cu timpi de supraviețuire mai mari obțin scoruri mai mari din model, indicele c al modelului va fi mare.

Întrebarea mea este: se poate interpreta scorul ca fiind riscul subiectului? Cu alte cuvinte, subiecții cu scoruri mai mici (care indică perioade de supraviețuire mai scurte) corespund unui risc mai mare de eșec?

Comentarii

  • Cu siguranță nu este la fel ca riscul pe care l-ați calcula riscul relativ între două curbe de supraviețuire. Dar pare evident că concordanța măsoară modul în care o clasare este corelată cu clasarea bazată pe supraviețuire. Deci, dacă indicele de concordanță este ridicat pentru un anumit clasament, atunci clasamentul este bun la separarea subiecților cu risc ridicat de risc scăzut în funcție de rang.
  • @MichaelChernick vă mulțumesc din nou. În ultima propoziție, ce vrei să spui exact prin " subiecți " cu risc ridicat? Riscul de eșec în cele din urmă? sau riscul de eșec în orice moment? De exemplu, să presupunem că subiectul A este clasat mai sus decât subiectul B, știm atunci că timpul de supraviețuire estimat al lui A este mai scurt decât B, înseamnă, de asemenea, că riscul de eșec al lui A este mai mare decât B la un anumit moment T ?

Răspuns

Indicele de concordanță este un index „global” pentru validarea predictivului capacitatea unui model de supraviețuire. Este fracțiunea de perechi din datele dvs., unde observarea cu timpul de supraviețuire mai mare are probabilitatea mai mare de supraviețuire prevăzută de modelul dvs. Din câte îmi amintesc, echivalează cu o corelație de rang.

Indicele nu este calculat pentru fiecare observație / subiect. Deci, indexul c nu poate fi interpretat ca riscul unui subiect. Valori ridicate înseamnă că modelul dvs. prezice probabilități mai mari de supraviețuire pentru timpi de supraviețuire observați mai mari.

Dacă sunteți interesat de riscul unui subiect într-o perioadă de timp t, cred că trebuie să estimați funcția de supraviețuire și pericol pentru un set dat de regresori. Principala mea referință pe acest subiect este Harrell (2001): Rgression Modeling Strategies, Springer

Comments

  • De asemenea, are o anumită relație (echivalență?) Cu AUROC pentru clasificare. Consultați biostat.ucsf.edu/vgsm secțiunea 10.1.2.

Răspuns

Risc ridicat prin definiția dvs. înseamnă că este posibil să aibă durate scurte de supraviețuire.

Comentarii

  • OK, în sfârșit, noi ajunge aici! Dar credeți că este rezonabil să credeți că subiecții cu perioade de supraviețuire mai scurte sunt mai predispuși la eșec la un anumit moment T ? div id = „6e752c9ca8″>

regulă.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *