Compte tenu des taux de vrais positifs et de faux négatifs, pouvez-vous calculer des faux positifs, des vrais négatifs?

Jai des valeurs pour True Positive (TP) et False Negative (FN) comme suit:

TP = 0.25 FN = 0.75 

À partir de ces valeurs, pouvons-nous calculer False Positive (FP) et True Negative (TN)?

Réponse

Il y a un peu de confusion terminologique dans ce domaine. Personnellement, je trouve toujours utile de revenir sur une matrice de confusion pour y réfléchir. Dans un test de classification / dépistage, vous pouvez avoir quatre situations différentes:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

Dans ce tableau, « vrai positif », « faux négatif », « faux positif »Et« vrai négatif »sont des événements (ou leur probabilité). Vous avez donc probablement un taux vrai positif et un taux faux négatif. La distinction est importante car elle souligne que les deux nombres ont un numérateur et un dénominateur.

Là où les choses deviennent un peu confuses, cest que vous pouvez trouver plusieurs définitions de «taux de faux positifs» et de «taux de faux négatifs», avec différents dénominateurs.

Par exemple, Wikipedia fournit les définitions suivantes (elles semblent assez standard):

  • Taux de vrais positifs (ou sensibilité): $ TPR = TP / (TP + FN) $
  • Taux de faux positifs: $ FPR = FP / (FP + TN) $
  • True taux négatif (ou spécificité): $ TNR = TN / (FP + TN) $

Dans tous les cas, le dénominateur est le total de la colonne . Cela donne également un indice à leur interprétation: le taux de vrais positifs est la probabilité que le test dise «A» lorsque la valeur réelle est effectivement A (cest-à-dire quil sagit dune probabilité conditionnelle, conditionnée à ce que A soit vrai). Cela ne vous dit pas quelle est la probabilité que vous ayez raison lorsque vous appelez «A» (cest-à-dire la probabilité dun vrai positif, sous réserve que le résultat du test soit «A»).

En supposant que le taux de faux négatifs est défini de la même manière, nous avons alors $ FNR = 1 – TPR $ (notez que vos chiffres sont cohérents avec cela). Nous ne pouvons cependant pas dériver directement le taux de faux positifs à partir des taux de vrais positifs ou de faux négatifs car ils ne fournissent aucune information sur la spécificité, cest-à-dire sur le comportement du test lorsque «pas A» est la bonne réponse. La réponse à votre question serait donc «non, ce nest pas possible» car vous navez aucune information sur la colonne de droite de la matrice de confusion.

Il existe cependant dautres définitions dans la littérature. Par exemple, Fleiss ( Méthodes statistiques pour les taux et les proportions ) propose ce qui suit:

  • « […] le taux de faux positifs […] est la proportion de personnes, parmi celles qui ont répondu positives, qui sont réellement indemnes de la maladie. »
  • « Le taux de faux négatifs […] est la proportion de personnes, parmi celles qui ont répondu négatifs au test, qui ont néanmoins la maladie. »

(Il reconnaît également les définitions précédentes mais les considère comme« un gaspillage de terminologie précieuse », précisément parce qu’elles ont une relation directe avec la sensibilité et spécificité.)

En se référant à la matrice de confusion, cela signifie que $ FPR = FP / (TP + FP) $ et $ FNR = FN / (TN + FN) $ donc les dénominateurs sont les les totaux des lignes . I De manière importante, selon ces définitions, les taux de faux positifs et de faux négatifs ne peuvent pas être directement déduits de la sensibilité et de la spécificité du test. Vous devez également connaître la prévalence (cest-à-dire la fréquence de A dans la population concernée).

Fleiss nutilise ni ne définit les expressions «taux vraiment négatif» ou «taux vraiment positif», mais si nous supposons que ce sont aussi des probabilités conditionnelles étant donné un résultat / une classification de test particulier, alors la réponse @ guill11aume est la bonne.

Dans tous les cas, vous devez faire attention aux définitions car il ny a pas de réponse incontestable à votre question.

Commentaires

  • Très bien (+1). Jai immédiatement sauté sur une interprétation, mais vous avez parfaitement raison de dire que la définition alternative est standard.
  • @ gui11aume. Merci! Cétait mon sentiment mais en y pensant, je nen suis plus si sûr. En regardant les références, cela peut dépendre du domaine (apprentissage automatique vs tests médicaux).
  • Mon expérience est que cette dernière définition, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) est plus standard.
  • Ici ' une publication sur les différences: link.springer. com / article / 10.1007 / s10899-006-9025-5 # énumération Notez la nouvelle terminologie " Test FPR " vs . " Predictive FPR "

Réponse

EDIT: voir la réponse de Gaël Laurans, qui est plus précise.

Si votre vrai taux positif est de 0.Cela signifie que chaque fois que vous appelez un positif, vous avez une probabilité de 0,75 davoir tort. Ceci est votre taux de faux positifs. De même, chaque fois que vous appelez un négatif, vous avez une probabilité de 0,25 davoir raison, ce qui est votre vrai taux de négatif.

Commentaires

  • Dépend sur ce que lon essaie de caractériser: le test dans le cadre de savoir à lavance la vérité, ou essayer de décider de la probabilité post-test juste compte tenu des résultats en main.

Réponse

Aucune si cela a un sens si « positif » et « négatif » nont pas de sens pour le problème en question. Je vois de nombreux problèmes où «positif» et «négatif» sont des choix forcés arbitraires sur une variable ordinale ou continue. FP, TP, sens, spec ne sont utiles que pour les phénomènes tout ou rien.

Answer

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *