Având în vedere ratele adevărate pozitive, fals negative, puteți calcula fals pozitiv, adevăratul negativ?

Am valori pentru True Positive (TP) și False Negative (FN) după cum urmează:

TP = 0.25 FN = 0.75 

Din acele valori, putem calcula False Positive (FP) și True Negative (TN)?

Răspuns

Există destul de puțină confuzie terminologică în acest domeniu. Personal, întotdeauna mi se pare util să revin la o matrice de confuzie pentru a mă gândi la acest lucru. Într-un test de clasificare / screening, puteți avea patru situații diferite:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

În acest tabel, „adevărat pozitiv”, „fals negativ”, „fals pozitiv” ”Și„ adevăratul negativ ”sunt evenimente (sau probabilitatea lor). Prin urmare, ceea ce aveți este probabil o adevărată rată pozitivă și o falsă rată negativă. Distincția contează deoarece subliniază faptul că ambele numere au un numărător și un numitor.

Unde lucrurile devin puțin confuze este că puteți găsi mai multe definiții ale „ratei fals pozitive” și „ratei fals negative”, cu diferiți numitori.

De exemplu, Wikipedia oferă următoarele definiții (par destul de standard):

  • Rată pozitivă adevărată (sau sensibilitate): $ TPR = TP / (TP + FN) $
  • Rată fals pozitivă: $ FPR = FP / (FP + TN) $
  • Adevărat rata negativă (sau specificitate): $ TNR = TN / (FP + TN) $

În toate cazurile, numitorul este coloana totală. Acest lucru oferă, de asemenea, un indiciu pentru interpretarea lor: adevărata rată pozitivă este probabilitatea ca testul să spună „A” atunci când valoarea reală este într-adevăr A (adică este o probabilitate condiționată, condiționată de faptul că A este adevărat). Acest lucru nu nu vă spune cât de probabil sunteți corect să apelați „A” (adică probabilitatea unui adevărat pozitiv, condiționat de rezultatul testului să fie „A”).

Presupunând că rata negativă falsă este definită în același mod, avem apoi $ FNR = 1 – TPR $ (rețineți că numerele dvs. sunt în concordanță cu aceasta). Cu toate acestea, nu putem deriva în mod direct rata fals pozitivă nici din ratele adevărate pozitive, nici din cele negative negative, deoarece acestea nu furnizează informații despre specificitate, adică modul în care se comportă testul atunci când „nu A” este răspunsul corect. Răspunsul la întrebarea dvs. ar fi, așadar, „nu,„ nu este posibil ”, deoarece nu aveți informații în coloana din dreapta a matricei de confuzie.

Există totuși alte definiții în literatură. De exemplu, Fleiss ( Metode statistice pentru rate și proporții ) oferă următoarele:

  • „[…] rata fals pozitivă […] este proporția de persoane, dintre cele care au răspuns pozitive, care sunt de fapt libere de boală. ”
  • „ Rata fals negativă […] este proporția de oameni, dintre cei care răspund negativ la test, care totuși au boala. ”

(El recunoaște și definițiile anterioare, dar le consideră„ risipitoare de terminologie prețioasă ”, tocmai pentru că au o relație directă cu sensibilitatea și specificitate.)

Referindu-ne la matricea de confuzie, înseamnă că $ FPR = FP / (TP + FP) $ și $ FNR = FN / (TN + FN) $, astfel încât numitorii sunt rând totaluri. I important, sub aceste definiții, ratele fals pozitive și fals negative nu pot fi derivate direct din sensibilitatea și specificitatea testului. De asemenea, trebuie să cunoașteți prevalența (de exemplu, cât de frecventă este A în populația de interes).

Fleiss nu folosește sau definește sintagmele „adevărată rată negativă” sau „adevărata rată pozitivă”, dar dacă presupunem că acestea sunt, de asemenea, probabilități condiționale, având în vedere un anumit rezultat / clasificare a testului, atunci răspunsul @ guill11aume este corect.

În orice caz, trebuie să aveți grijă cu definițiile, deoarece nu există un răspuns incontestabil la întrebarea dvs.

Comentarii

  • Foarte bine (+1). Am sărit imediat pe o singură interpretare, dar aveți dreptate că definiția alternativă este standard.
  • @ gui11aume. Mulțumiri! A fost sentimentul meu, dar gândindu-mă la asta, nu mai sunt atât de sigur. Privind referințele, ar putea depinde de domeniu (învățare automată vs. testare medicală).
  • Experiența mea este că această din urmă definiție, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) este mai standard.
  • Aici ' o publicație despre diferențele: link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration Rețineți noua terminologie " Test FPR " vs. . " FPR predictiv "

Răspuns

EDIT: vezi răspunsul lui Gaël Laurans, care este mai precis.

Dacă adevărata rată pozitivă este 0.25 înseamnă că de fiecare dată când numiți un pozitiv, aveți o probabilitate de 0,75 de a greși. Aceasta este rata dvs. fals pozitivă. În mod similar, de fiecare dată când apelați la un negativ, aveți o probabilitate de 0,25 să aveți dreptate, care este adevărata rată negativă.

Comentarii

  • Depinde cu privire la ceea ce se încearcă să caracterizeze: testul în contextul cunoașterii adevărului în prealabil sau încercarea de a decide cu privire la probabilitatea post-test tocmai având în vedere rezultatele în mână.

Răspuns

Niciunul dacă acest lucru are sens dacă „pozitiv” și „negativ” nu au sens pentru problema în cauză. Văd multe probleme în care „pozitiv” și „negativ” sunt alegeri forțate arbitrare pe o variabilă ordinală sau continuă. FP, TP, sens, spec sunt utile numai pentru fenomene totul sau nimic.

Răspuns

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *