Jai publié une question « similaire » dans un autre fil de discussion . Mais je pense que cette question nest pas assez spécifique / concrète pour obtenir la réponse que jattendais.
Je sais que, dans lanalyse de survie, lindice de concordance (c-index) peut être utilisé pour mesurer la qualité dun classement la liste contient les temps de survie des sujets (FE Harrell, 1996, section 5.5). Autrement dit, si les sujets avec des temps de survie plus élevés obtiennent des scores plus élevés du modèle, le c-index du modèle sera grand.
Ma question est: le score peut-il être interprété comme le risque du sujet? En dautres termes, les sujets avec des scores plus petits (ce qui indique des temps de survie plus courts) correspondent-ils à un risque déchec plus important?
Commentaires
- Ce nest certainement pas le identique au risque que vous feriez pour calculer le risque relatif entre deux courbes de survie. Mais il semble évident que la concordance mesure la corrélation dun classement avec le classement basé sur la survie. Donc, si lindice de concordance est élevé pour un classement particulier, le classement est bon pour séparer les sujets à haut risque des sujets à faible risque en fonction du rang.
- @MichaelChernick merci encore. Dans votre dernière phrase, quentendez-vous exactement par sujets " à haut risque "? Le risque déchec finalement? ou le risque déchec à tout moment? Par exemple, supposons que le sujet A soit classé plus haut que le sujet B, nous savons alors que le temps de survie estimé de A est plus court que B, cela signifie-t-il également que le risque déchec de A est supérieur à B à un moment donné T ?
Réponse
Lindice de concordance est un index « global » de validation du prédictif capacité dun modèle de survie. Il sagit de la fraction de paires dans vos données, où lobservation avec le temps de survie le plus élevé a la probabilité de survie la plus élevée prévue par votre modèle. Pour autant que je men souvienne, cela équivaut à une corrélation de rang.
Lindice nest pas calculé pour chaque observation / sujet. Le c-index ne peut donc pas être interprété comme le risque dun sujet. Des valeurs élevées signifient que votre modèle prédit des probabilités de survie plus élevées pour des temps de survie observés plus élevés.
Si vous êtes intéressé par le risque dun sujet dans une période de temps t, je pense que vous devez estimer la fonction de survie et de risque pour un ensemble donné de régresseurs. Ma principale référence à ce sujet est Harrell (2001): Stratégies de modélisation de régression, Springer
Commentaires
- Il a également une relation (équivalence?) À AUROC pour la classification. Voir la biostat.ucsf.edu/vgsm section 10.1.2.
Réponse
Selon votre définition, le risque élevé est susceptible davoir des temps de survie courts.
Commentaires
- OK, enfin nous viens ici! Mais pensez-vous quil est raisonnable de penser que les sujets avec des temps de survie plus courts sont plus susceptibles déchouer à un moment donné T ?
- Vous pourriez lécrire comme un calcul en utilisant Bayes ' règle.