Ich habe Werte für True Positive (TP)
und False Negative (FN)
wie folgt:
TP = 0.25 FN = 0.75
Können wir aus diesen Werten False Positive (FP)
und True Negative (TN)
?
Antwort
In diesem Bereich gibt es einige terminologische Verwirrung. Persönlich finde ich es immer nützlich, zu einer Verwirrungsmatrix zurückzukehren, um darüber nachzudenken. In einem Klassifizierungs- / Screening-Test können vier verschiedene Situationen auftreten:
Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative
In dieser Tabelle „wahr positiv“, „falsch negativ“, „falsch positiv“ „Und“ wahres Negativ „sind Ereignisse (oder deren Wahrscheinlichkeit). Was Sie haben, ist daher wahrscheinlich eine echte positive Rate und eine falsch negative Rate . Die Unterscheidung ist wichtig, weil sie betont, dass beide Zahlen einen Zähler und einen Nenner haben.
Wenn die Dinge etwas verwirrend werden, finden Sie verschiedene Definitionen von „falsch positiver Rate“ und „falsch negativer Rate“ mit verschiedene Nenner.
Zum Beispiel bietet Wikipedia die folgenden Definitionen (sie scheinen ziemlich normal zu sein):
- Richtig positive Rate (oder Empfindlichkeit): $ TPR = TP / (TP + FN) $
- Falsch positive Rate: $ FPR = FP / (FP + TN) $
- Richtig negative Rate (oder Spezifität): $ TNR = TN / (FP + TN) $
In allen Fällen ist der Nenner die Summe der Spalten . Dies gibt auch einen Hinweis auf ihre Interpretation: Die wahre positive Rate ist die Wahrscheinlichkeit, dass der Test „A“ sagt, wenn der reale Wert tatsächlich A ist (d. H. Es ist eine bedingte Wahrscheinlichkeit, die davon abhängig ist, dass A wahr ist). Dies sagt Ihnen nicht , wie wahrscheinlich es ist, dass Sie korrekt sind, wenn Sie „A“ aufrufen (dh die Wahrscheinlichkeit eines echten Positivs, abhängig davon, dass das Testergebnis „A“ ist).
Unter der Annahme, dass die falsch negative Rate auf die gleiche Weise definiert ist, haben wir $ FNR = 1 – TPR $ (beachten Sie, dass Ihre Zahlen damit übereinstimmen). Wir können die falsch-positive Rate jedoch nicht direkt aus den wahr-positiven oder falsch-negativen Raten ableiten, da sie keine Informationen über die Spezifität liefern, d. H. Wie sich der Test verhält, wenn „nicht A“ die richtige Antwort ist. Die Antwort auf Ihre Frage wäre daher „Nein, es ist nicht möglich“, da Sie keine Informationen in der rechten Spalte der Verwirrungsmatrix haben.
Es gibt jedoch andere Definitionen in der Literatur. Zum Beispiel: Fleiss ( Statistische Methoden für Raten und Proportionen ) bietet Folgendes:
- “[…] Die falsch-positive Rate […] ist der Anteil der Personen unter den Befragten, die positiv sind und tatsächlich frei von der Krankheit sind. “
- „ Die falsch-negative Rate […] ist der Anteil der Personen unter den Befragten negativ auf den Test, die dennoch an der Krankheit leiden. “
(Er erkennt auch die vorherigen Definitionen an, betrachtet sie jedoch als„ Verschwendung wertvoller Terminologie “, gerade weil sie eine direkte Beziehung zu Sensitivität und Sensibilität haben Spezifität.)
In Bezug auf die Verwirrungsmatrix bedeutet dies, dass $ FPR = FP / (TP + FP) $ und $ FNR = FN / (TN + FN) $, sodass die Nenner die sind Zeilensummen. I. Wichtig ist, dass unter diesen Definitionen die falsch positiven und falsch negativen Raten nicht direkt aus der Sensitivität und Spezifität des Tests abgeleitet werden können. Sie müssen auch die Prävalenz kennen (dh wie häufig A in der interessierenden Bevölkerung vorkommt).
Fleiss verwendet oder definiert die Ausdrücke „wahre negative Rate“ oder „wahre positive Rate“ nicht, aber wenn Wir gehen davon aus, dass dies auch bedingte Wahrscheinlichkeiten für ein bestimmtes Testergebnis / eine bestimmte Klassifizierung sind. Dann ist die Antwort von @ guill11aume die richtige.
In jedem Fall müssen Sie mit den Definitionen vorsichtig sein, da es keine unbestreitbare Antwort auf gibt Ihre Frage.
Kommentare
- Sehr gut (+1). Ich bin sofort auf eine Interpretation gesprungen, aber Sie haben absolut Recht, dass die alternative Definition Standard ist.
- @ gui11aume. Vielen Dank! Es war mein Gefühl, aber wenn ich darüber nachdenke, bin ich mir nicht mehr so sicher. Wenn man sich die Referenzen ansieht, kann dies vom Fachgebiet abhängen (maschinelles Lernen vs. medizinische Tests).
- Ich habe die Erfahrung gemacht, dass die letztere Definition TPR = TP / (TP + FP), FPR = FP / ( TP + FP) ist mehr Standard.
- Hier ' ist eine Veröffentlichung zu den Unterschieden: link.springer. com / article / 10.1007 / s10899-006-9025-5 # Aufzählung Beachten Sie die neue Terminologie " Test FPR " vs. " Predictive FPR "
Antwort
BEARBEITEN: siehe die Antwort von Gaël Laurans, die genauer ist.
Wenn Ihre wahre positive Rate 0 ist.25 Dies bedeutet, dass Sie jedes Mal, wenn Sie ein Positiv aufrufen, mit einer Wahrscheinlichkeit von 0,75 falsch liegen. Dies ist Ihre falsch positive Rate. In ähnlicher Weise haben Sie jedes Mal, wenn Sie ein Negativ aufrufen, eine Wahrscheinlichkeit von 0,25, richtig zu sein. Dies ist Ihre wahre negative Rate.
Kommentare
- Abhängig über das, was man zu charakterisieren versucht: den Test in der Einstellung, die Wahrheit vorher zu kennen, oder den Versuch, über die Wahrscheinlichkeit nach dem Test zu entscheiden, wenn nur die vorliegenden Ergebnisse vorliegen.
Antwort
Keine, wenn dies sinnvoll ist, wenn „positiv“ und „negativ“ für das vorliegende Problem keinen Sinn ergeben. Ich sehe viele Probleme, bei denen „positiv“ und „negativ“ willkürliche erzwungene Entscheidungen für eine ordinale oder kontinuierliche Variable sind. FP, TP, sens, spec sind nur für Alles-oder-Nichts-Phänomene nützlich.