Az igaz pozitív, hamis negatív arányokat figyelembe véve kiszámíthat-e hamis pozitív, igaz negatív értéket?

A True Positive (TP) és a False Negative (FN) értékek a következők:

TP = 0.25 FN = 0.75 

Ezekből az értékekből kiszámíthatjuk False Positive (FP) és True Negative (TN)?

Válasz

Elég sok terminológiai zavar van ezen a területen. Személy szerint mindig hasznosnak tartom visszatérni egy zavartsági mátrixhoz, hogy ezen gondolkodjak. Osztályozási / szűrési teszten négy különböző helyzet állhat elő:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

Ebben a táblázatban „igaz pozitív”, „hamis negatív”, „hamis pozitív” ”És az„ igazi negatív ”események (vagy azok valószínűsége). Ezért valószínűleg valódi pozitív arány és hamis negatív arány . A megkülönböztetés azért fontos, mert hangsúlyozza, hogy mindkét számnak van számlálója és nevezője.

A dolgok kissé zavarosak, ha a „hamis pozitív arány” és a „hamis negatív arány” több meghatározását is megtalálhatja különböző nevezők.

Például a Wikipédia a következő definíciókat nyújtja (elég szabványosnak tűnik):

  • Igaz pozitív arány (vagy érzékenység): $ TPR = TP / (TP + FN) $
  • Hamis pozitív arány: $ FPR = FP / (FP + TN) $
  • True negatív ráta (vagy specifitás): $ TNR = TN / (FP + TN) $

A nevező minden esetben az oszlop összesen. Ez utalást ad az értelmezésükre is: Az igazi pozitív arány annak a valószínűsége, hogy a teszt „A” -t mond, amikor a valós érték valóban A (azaz feltételes valószínűség, feltételként feltételezve, hogy A igaz). Ez nem nem árulja el, mennyire valószínű, hogy igaza van az „A” hívásakor (vagyis a valódi pozitív valószínűsége, attól függően, hogy a teszt eredménye „A”).

Ha feltételezzük, hogy a hamis negatív arányt ugyanúgy definiáljuk, akkor $ FNR = 1 – TPR $ (vegye figyelembe, hogy a számai ezzel összhangban vannak). A hamis pozitív arányt azonban közvetlenül sem a valódi pozitív, sem a hamis negatív arányból nem vezethetjük le, mert nem adnak információt a specifitásról, vagyis arról, hogy a teszt hogyan viselkedik, amikor a „nem A” a helyes válasz. A kérdésedre tehát a válasz “nem, ez nem lehetséges”, mert nincs információ a zavaros mátrix jobb oszlopában.

Az irodalomban azonban vannak más meghatározások is. Például: A Fleiss ( statisztikai módszerek arányokhoz és arányokhoz ) a következőket kínálja:

  • „[…] a hamis pozitív arány […] az emberek aránya azok között a pozitív válaszadók között, akik valóban mentesek a betegségtől. ”
  • „ A hamis negatív arány […] az emberek aránya, a válaszadók között. negatív a teszten, akiknek ennek ellenére van a betegségük. ”

(Elismeri a korábbi definíciókat is, de„ az értékes terminológiát pazarlónak ”tartja, éppen azért, mert egyenes kapcsolatban állnak az érzékenységgel és specifitás.)

A zavaros mátrixra utalva azt jelenti, hogy $ FPR = FP / (TP + FP) $ és $ FNR = FN / (TN + FN) $, tehát a nevezők a sor összesítés. I Fontos, hogy ezekben a meghatározásokban a hamis pozitív és a hamis negatív arányok közvetlenül nem vezethetők le a teszt érzékenységéből és specificitásából. Ismernie kell a prevalenciát (azaz azt is, hogy az A milyen gyakorisággal fordul elő az érdeklődő populációban).

A Fleiss nem használja vagy határozza meg az „igaz negatív ráta” vagy az „igazi pozitív arány” kifejezéseket, de ha feltételezzük, hogy ezek szintén feltételes valószínűségek, adott teszt eredmény / besorolás alapján, akkor a @ guill11aume válasz a helyes.

Mindenesetre óvatosnak kell lenned a definíciókkal, mert nincs vitathatatlan válasz kérdése.

Megjegyzések

  • Nagyon jó (+1). Rögtön rátértem az egyik értelmezésre, de teljesen igazad van abban, hogy az alternatív definíció szabványos.
  • @ gui11aume. Köszönöm! Ez az érzésem volt, de ezen gondolkodva már nem vagyok annyira biztos. A referenciákat tekintve ez függhet a területtől (gépi tanulás vs. orvosi tesztelés).
  • Az a tapasztalatom, hogy ez utóbbi definíció, TPR = TP / (TP + FP), FPR = FP / ( A TP + FP) szabványosabb.
  • Itt ' közöljük a különbségeket: link.springer. com / article / 10.1007 / s10899-006-9025-5 # felsorolás Vegye figyelembe az új terminológiát " Tesztelje az FPR-t . " Prediktív FPR "

Válasz

SZERKESZTÉS: lásd Gaël Laurans pontosabb válaszát.

Ha valódi pozitív aránya 0.Ez azt jelenti, hogy valahányszor pozitívat hív, 0,75 valószínűséggel téved. Ez a hamis pozitív arányod. Hasonlóképpen, minden alkalommal, amikor negatívat hív, akkor annak valószínűsége, hogy igaza van, ez az igazi negatív aránya.

Megjegyzések

  • Attól függ arról, amit jellemezni próbál: a teszt az igazság előzetes megismerésében, vagy a teszt utáni valószínűség eldöntésében éppen az eredményeket figyelembe véve.

Válasz

Nincs, ha ennek van értelme, ha a “pozitív” és “negatív” nincs értelme az adott problémának. Sok problémát látok, ahol a “pozitív” és a “negatív” önkényes kényszerített választás a soros vagy a folyamatos változóra. Az FP, TP, sens, spec csak a “mindent vagy semmit” jelenségeknél hasznos.

Válasz

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük