Dati i tassi di veri positivi e falsi negativi, puoi calcolare i falsi positivi, i veri negativi?

Ho valori per True Positive (TP) e False Negative (FN) come segue:

TP = 0.25 FN = 0.75 

Da questi valori, possiamo calcolare False Positive (FP) e True Negative (TN)?

Risposta

Cè un po di confusione terminologica in questarea. Personalmente, trovo sempre utile tornare a una matrice di confusione per riflettere su questo. In un test di classificazione / screening, puoi avere quattro diverse situazioni:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

In questa tabella, “vero positivo”, “falso negativo”, “falso positivo “E” vero negativo “sono eventi (o la loro probabilità). Quello che hai è quindi probabilmente un tasso vero positivo e un tasso falso negativo. La distinzione è importante perché sottolinea che entrambi i numeri hanno un numeratore e un denominatore.

Dove le cose diventano un po confuse è che puoi trovare diverse definizioni di “tasso di falsi positivi” e “tasso di falsi negativi”, con denominatori diversi.

Ad esempio, Wikipedia fornisce le seguenti definizioni (sembrano piuttosto standard):

  • Tasso di veri positivi (o sensibilità): $ TPR = TP / (TP + FN) $
  • Tasso di falsi positivi: $ FPR = FP / (FP + TN) $
  • Vero tasso negativo (o specificità): $ TNR = TN / (FP + TN) $

In tutti i casi, il denominatore è il totale della colonna . Questo fornisce anche uno spunto per la loro interpretazione: il tasso di vero positivo è la probabilità che il test dica “A” quando il valore reale è effettivamente A (cioè, è una probabilità condizionata, condizionata al fatto che A sia vero). Questo non ti dice quanto è probabile che tu abbia ragione quando chiami “A” (cioè, la probabilità di un vero positivo, condizionata dal risultato del test “A”).

Supponendo che il tasso di falsi negativi sia definito allo stesso modo, allora abbiamo $ FNR = 1 – TPR $ (nota che i tuoi numeri sono coerenti con questo). Non possiamo tuttavia derivare direttamente il tasso di falsi positivi né dal tasso di veri positivi né da quello di falsi negativi perché non forniscono informazioni sulla specificità, ovvero come si comporta il test quando “non A” è la risposta corretta. La risposta alla tua domanda sarebbe quindi “no, non è possibile” perché non hai informazioni sulla colonna di destra della matrice di confusione.

Ci sono tuttavia altre definizioni in letteratura. Ad esempio, Fleiss ( Metodi statistici per tassi e proporzioni ) offre quanto segue:

  • “[…] il tasso di falsi positivi […] è la proporzione di persone, tra coloro che rispondono positivi che sono effettivamente liberi dalla malattia. “
  • ” Il tasso di falsi negativi […] è la percentuale di persone, tra coloro che rispondono negativo al test, che tuttavia ha la malattia. “

(Riconosce anche le definizioni precedenti ma le considera” sprecate di preziosa terminologia “, proprio perché hanno un rapporto diretto con sensibilità e specificità.)

Facendo riferimento alla matrice di confusione, significa che $ FPR = FP / (TP + FP) $ e $ FNR = FN / (TN + FN) $ quindi i denominatori sono totali di riga . I È importante sottolineare che, secondo queste definizioni, le percentuali di falsi positivi e falsi negativi non possono essere derivate direttamente dalla sensibilità e specificità del test. È inoltre necessario conoscere la prevalenza (ovvero, quanto è frequente A nella popolazione di interesse).

Fleiss non utilizza né definisce le frasi “tasso di veri negativi” o “tassi di veri positivi” ma se presumiamo che anche quelle siano probabilità condizionali dato un particolare risultato / classificazione del test, quindi la risposta di @ guill11aume è quella corretta.

In ogni caso, devi stare attento con le definizioni perché non esiste una risposta indiscutibile a la tua domanda.

Commenti

  • Molto buono (+1). Sono subito saltato su uninterpretazione, ma hai perfettamente ragione sul fatto che la definizione alternativa è standard.
  • @ gui11aume. Grazie! Era una mia sensazione, ma a pensarci non sono più così sicuro. Guardando i riferimenti, potrebbe dipendere dal campo (apprendimento automatico vs. test medici).
  • La mia esperienza è che questultima definizione, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) è più standard.
  • Qui ' una pubblicazione sulle differenze: link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration Nota la nuova terminologia " Test FPR " vs . " FPR predittivo "

Risposta

MODIFICA: vedi la risposta di Gaël Laurans, che è più precisa.

Se il tuo tasso di veri positivi è 0.25 significa che ogni volta che chiami positivo, hai una probabilità di 0,75 di sbagliare. Questa è la tua percentuale di falsi positivi. Allo stesso modo, ogni volta che chiami negativo, hai una probabilità di 0,25 di avere ragione, che è il tuo vero tasso negativo.

Commenti

  • Dipende su ciò che si sta cercando di caratterizzare: il test nellimpostazione sulla conoscenza della verità in anticipo, o il tentativo di decidere sulla probabilità post-test solo dati i risultati in mano.

Risposta

Nessuno se ha senso se “positivo” e “negativo” non hanno senso per il problema in questione. Vedo molti problemi in cui “positivo” e “negativo” sono scelte forzate arbitrarie su una variabile ordinale o continua. FP, TP, sens, spec sono utili solo per i fenomeni tutto o niente.

Risposta

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *