Vzhledem k skutečně pozitivním, falešně negativním sazbám, můžete vypočítat falešně pozitivní, skutečně negativní?

Mám hodnoty pro True Positive (TP) a False Negative (FN) takto:

TP = 0.25 FN = 0.75 

Z těchto hodnot můžeme vypočítat False Positive (FP) a True Negative (TN)?

Odpověď

V této oblasti panuje značný terminologický zmatek. Osobně mi vždy přijde užitečné vrátit se k matici zmatků, abych o tom přemýšlel. V klasifikačním / screeningovém testu můžete mít čtyři různé situace:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

V této tabulce „true positive“, „false positive“, „false positive“ „A„ skutečně negativní “jsou události (nebo jejich pravděpodobnost). Máte tedy pravděpodobně skutečnou pozitivní sazbu a falešně negativní sazbu . Rozdíl je důležitý, protože zdůrazňuje, že obě čísla mají čitatele i jmenovatele.

Trochu matoucí je to, že můžete najít několik definic „falešně pozitivní sazby“ a „falešně negativní sazby“ s různých jmenovatelů.

Například Wikipedia poskytuje následující definice (vypadají docela standardně):

  • Skutečná kladná sazba (nebo citlivost): $ TPR = TP / (TP + FN) $
  • Falešná kladná sazba: $ FPR = FP / (FP + TN) $
  • Pravda záporná sazba (nebo specificita): $ TNR = TN / (FP + TN) $

Ve všech případech je jmenovatelem sloupec celkem. To také dává podnět k jejich interpretaci: Skutečná kladná míra je pravděpodobnost, že test říká „A“, když skutečná hodnota je skutečně A (tj. Je to podmíněná pravděpodobnost, podmíněná skutečností A). To ne vám neřekne, jak velká je pravděpodobnost, že budete mít pravdu, když budete volat „A“ (tj. Pravděpodobnost skutečně pozitivního výsledku, podmíněného tím, že výsledek testu bude „A“).

Za předpokladu, že míra falešně negativních výsledků je definována stejným způsobem, pak máme $ FNR = 1 – TPR $ (všimněte si, že vaše čísla jsou v souladu s tímto). Nemůžeme však přímo odvodit míru falešně pozitivních výsledků od skutečných pozitivních nebo falešně negativních hodnot, protože neposkytují žádné informace o specificitě, tj. O tom, jak se test chová, když „správná odpověď není“. Odpověď na vaši otázku by proto byla „ne, není to možné“, protože o pravém sloupci matice záměny nemáte žádné informace.

V literatuře však existují i jiné definice. Například Fleiss ( Statistické metody pro sazby a proporce ) nabízí následující:

  • „[…] míra falešně pozitivních výsledků […] je podíl lidí z těch, kteří reagují pozitivně a kteří jsou ve skutečnosti bez onemocnění. “
  • „ Míra falešně negativních výsledků […] je podíl lidí, kteří reagují negativní v testu, kteří přesto mají nemoc. “

(Uznává také předchozí definice, ale považuje je za„ plýtvání drahocennou terminologií “, právě proto, že mají přímý vztah s citlivostí a specificita.)

S odkazem na matici zmatku to znamená, že $ FPR = FP / (TP + FP) $ a $ FNR = FN / (TN + FN) $, takže jmenovatelé jsou řádek součty. I Podstatně podle těchto definic nelze falešně pozitivní a falešně negativní sazby přímo odvodit z citlivosti a specificity testu. Musíte také znát prevalenci (tj. Jak často je A v populaci zájmu).

Fleiss nepoužívá ani nedefinuje fráze „skutečná záporná míra“ nebo „skutečná kladná míra“, ale pokud předpokládáme, že se jedná také o podmíněné pravděpodobnosti dané konkrétním výsledkem / klasifikací testu, pak je správná odpověď @ guill11aume.

V každém případě musíte být s definicemi opatrní, protože neexistuje nesporná odpověď na vaše otázka.

Komentáře

  • Velmi dobré (+1). Okamžitě jsem skočil na jeden výklad, ale máte naprostou pravdu, že alternativní definice je standardní.
  • @ gui11aume. Dík! Byl to můj pocit, ale přemýšlet o tom, už si nejsem tak jistý. Při pohledu na reference to může záviset na oboru (strojové učení vs. lékařské testování).
  • Moje zkušenost je, že druhá definice, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) je standardnější.
  • Zde ' sa publikace o rozdílech: link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration Všimněte si nové terminologie " Test FPR " vs . " Prediktivní FPR "

Odpovědět

EDIT: viz odpověď Gaëla Lauranse, která je přesnější.

Pokud je vaše skutečná kladná sazba 0.25 to znamená, že pokaždé, když zavoláte kladné číslo, máte pravděpodobnost 0,75, že se mýlíte. Toto je vaše míra falešně pozitivních výsledků. Podobně pokaždé, když zavoláte zápor, máte pravděpodobnost 0,25, že máte pravdu, což je vaše skutečná záporná sazba.

Komentáře

  • Závisí o tom, co se člověk snaží charakterizovat: test v nastavení předem známosti pravdy, nebo pokus o rozhodnutí o pravděpodobnosti po testu právě vzhledem k výsledkům v ruce.

Odpověď

Žádná, pokud to dává smysl, pokud „pozitivní“ a „negativní“ nemají pro daný problém smysl. Vidím mnoho problémů, kde „pozitivní“ a „negativní“ jsou libovolné vynucené volby na řadové nebo spojité proměnné. FP, TP, sens, spec jsou užitečné pouze pro jevy typu „všechno nebo nic“.

Odpověď

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *