Mam następujące wartości dla True Positive (TP)
i False Negative (FN)
:
TP = 0.25 FN = 0.75
Czy na podstawie tych wartości możemy obliczyć False Positive (FP)
i True Negative (TN)
?
Odpowiedź
W tej dziedzinie występuje spore zamieszanie terminologiczne. Osobiście zawsze uważam, że warto wrócić do matrycy zamieszania i pomyśleć o tym. W teście klasyfikacyjnym / przesiewowym mogą wystąpić cztery różne sytuacje:
Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative
W tej tabeli „prawdziwie pozytywne”, „fałszywie negatywne”, „fałszywie pozytywne ”I„ prawdziwie negatywne ”to zdarzenia (lub ich prawdopodobieństwo). To, co masz, to prawdopodobnie prawdziwie dodatnia stopa i fałszywie ujemna stopa . To rozróżnienie ma znaczenie, ponieważ podkreśla, że obie liczby mają licznik i mianownik.
Sprawy stają się nieco zagmatwane, ponieważ można znaleźć kilka definicji „współczynnika fałszywie dodatnich” i „fałszywie ujemnych”, z różne mianowniki.
Na przykład Wikipedia zawiera następujące definicje (wydają się one dość standardowe):
- Rzeczywiście dodatni współczynnik (lub czułość): $ TPR = TP / (TP + FN) $
- Fałszywie dodatni współczynnik: $ FPR = FP / (FP + TN) $
- True stopa ujemna (lub specyficzność): $ TNR = TN / (FP + TN) $
We wszystkich przypadkach mianownikiem jest kolumna ogółem. Daje to również wskazówkę do ich interpretacji: prawdziwie dodatni współczynnik to prawdopodobieństwo, że test mówi „A”, gdy rzeczywista wartość jest rzeczywiście A (tj. Jest to prawdopodobieństwo warunkowe, uwarunkowane tym, że A jest prawdziwe). To nie mówi Ci, jakie jest prawdopodobieństwo, że masz rację, dzwoniąc „A” (tj. Prawdopodobieństwo prawdziwego pozytywnego wyniku, uwarunkowane wynikiem testu jako „A”).
Zakładając, że współczynnik wyników fałszywie ujemnych jest zdefiniowany w ten sam sposób, mamy wtedy $ FNR = 1 – TPR $ (zwróć uwagę, że twoje liczby są z tym zgodne). Nie możemy jednak bezpośrednio wyprowadzić odsetka wyników fałszywie pozytywnych ani ze wskaźników prawdziwie pozytywnych, ani fałszywie ujemnych, ponieważ nie dostarczają one informacji o specyficzności, tj. O tym, jak zachowuje się test, gdy „nie A” jest poprawną odpowiedzią. Dlatego odpowiedź na twoje pytanie brzmiałaby „nie, to jest niemożliwe”, ponieważ nie masz informacji o prawej kolumnie macierzy pomyłki.
W literaturze istnieją jednak inne definicje. Na przykład Fleiss ( Metody statystyczne określające stawki i proporcje ) oferuje co następuje:
- „[…] współczynnik wyników fałszywie pozytywnych […] to odsetek osób, wśród tych z wynikiem pozytywnym, które faktycznie są wolne od choroby. ”
- „ Współczynnik wyników fałszywie ujemnych […] to odsetek ludzi wśród tych, którzy odpowiedzieli negatywny wynik testu, który mimo to ma chorobę. ”
(Uznaje również poprzednie definicje, ale uważa je za„ marnotrawstwo cennej terminologii ”, właśnie dlatego, że mają bezpośredni związek z wrażliwością i specyficzności.)
Odwołując się do macierzy pomyłki, oznacza to, że $ FPR = FP / (TP + FP) $ i $ FNR = FN / (TN + FN) $, więc mianownikami są wiersz sumy. I Co ważne, zgodnie z tymi definicjami odsetki wyników fałszywie dodatnich i fałszywie ujemnych nie mogą być bezpośrednio wyprowadzone z czułości i swoistości testu. Musisz również znać chorobowość (tj. Jak często występuje A w populacji będącej przedmiotem zainteresowania).
Fleiss nie używa ani nie definiuje wyrażeń „prawdziwie ujemna stopa” lub „prawdziwie dodatnia stopa”, ale jeśli zakładamy, że są to również prawdopodobieństwa warunkowe przy danym wyniku testu / klasyfikacji, to odpowiedź @ guill11aume jest poprawna.
W każdym razie musisz uważać z definicjami, ponieważ nie ma niepodważalnej odpowiedzi na Twoje pytanie.
Komentarze
- Bardzo dobrze (+1). Natychmiast zdecydowałem się na jedną interpretację, ale masz całkowitą rację, że alternatywna definicja jest standardowa.
- @ gui11aume. Dzięki! To było moje uczucie, ale myśląc o tym, nie jestem już taki pewien. Patrząc na odniesienia, może to zależeć od dziedziny (uczenie maszynowe a testy medyczne).
- Z mojego doświadczenia wynika, że ta ostatnia definicja, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) jest bardziej standardowy.
- Tutaj ' jest publikacją na temat różnic: link.springer. com / article / 10.1007 / s10899-006-9025-5 # wyliczenie Zwróć uwagę na nową terminologię " Przetestuj FPR " vs . " Predictive FPR "
Odpowiedź
EDYCJA: zobacz odpowiedź Gaël Laurans, która jest dokładniejsza.
Jeśli Twój prawdziwy dodatni współczynnik wynosi 0.25 oznacza to, że za każdym razem, gdy określasz wartość pozytywną, prawdopodobieństwo błędu wynosi 0,75. To jest twój fałszywie pozytywny wskaźnik. Podobnie, za każdym razem, gdy wywołasz negatyw, masz prawdopodobieństwo 0,25, że masz rację, co jest Twoją prawdziwą wartością ujemną.
Komentarze
- Zależy na tym, co próbujemy scharakteryzować: test w kontekście poznania prawdy z wyprzedzeniem lub próba podjęcia decyzji o prawdopodobieństwie po teście, biorąc pod uwagę właśnie otrzymane wyniki.
Odpowiedz
Brak, jeśli ma to jakiś sens, jeśli „pozytywne” i „negatywne” nie mają sensu w przypadku danego problemu. Widzę wiele problemów, w których „pozytywne” i „negatywne” to arbitralne, wymuszone wybory na zmiennej porządkowej lub ciągłej. FP, TP, sens, spec są przydatne tylko w przypadku zjawisk typu wszystko albo nic.