Kun otetaan huomioon tosi positiiviset, väärät negatiiviset hinnat, voitko laskea väärän positiivisen, tosi negatiivisen?

Minulla on arvot kohteille True Positive (TP) ja False Negative (FN) seuraavasti:

TP = 0.25 FN = 0.75 

Voimmeko näiden arvojen perusteella laskea False Positive (FP) ja True Negative (TN)?

Vastaus

Tällä alueella on melko vähän terminologista sekaannusta. Henkilökohtaisesti minusta on aina hyödyllistä palata sekaannusmatriisiin ajatellakseni tätä. Luokittelu- / seulontatestissä sinulla voi olla neljä erilaista tilannetta:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

Tässä taulukossa ”tosi positiivinen”, ”vääriä negatiivisia”, ”vääriä positiivisia” ”Ja” tosi negatiivinen ”ovat tapahtumia (tai niiden todennäköisyyttä). Siksi sinulla on todennäköisesti todellinen positiivinen korko ja väärä negatiivinen korko . Ero on tärkeä, koska siinä korostetaan, että molemmilla numeroilla on osoittaja ja nimittäjä.

Asiat hämmentävät hieman sitä, että löydät useita määritelmiä ”väärä positiivinen osuus” ja ”väärä negatiivinen prosentti”. eri nimittäjät.

Esimerkiksi Wikipedia tarjoaa seuraavat määritelmät (ne näyttävät melko tavallisilta):

  • Todellinen positiivinen osuus (tai herkkyys): $ TPR = TP / (TP + FN) $
  • Väärän positiivinen osuus: $ FPR = FP / (FP + TN) $
  • True negatiivinen osuus (tai spesifisyys): $ TNR = TN / (FP + TN) $

Kaikissa tapauksissa nimittäjä on sarake yhteensä. Tämä antaa myös vihjeen heidän tulkinnalleen: Todellinen positiivinen osuus on todennäköisyys, että testi sanoo ”A”, kun todellinen arvo on todellakin A (ts. Se on ehdollinen todennäköisyys, joka riippuu A: n olevan tosi). Tämä ei kerro sinulle, kuinka todennäköisesti olet oikeassa soittaessasi A: ta (ts. Todellisen positiivisen todennäköisyys, jos testitulos on A).

Olettaen, että väärä negatiivinen prosenttiosuus määritetään samalla tavalla, meillä on sitten $ FNR = 1 – TPR $ (huomaa, että luvut ovat yhdenmukaisia tämän kanssa). Emme kuitenkaan voi suoraan johtaa väärän positiivisen prosenttiosuutta joko todellisesta positiivisesta tai väärästä negatiivisesta prosenttiosuudesta, koska ne eivät tarjoa tietoa spesifisyydestä eli siitä, miten testi käyttäytyy, kun ”ei A” on oikea vastaus. Siksi vastaus kysymykseesi olisi ”ei, se ei ole mahdollista”, koska sekaannusmatriisin oikeassa sarakkeessa ei ole tietoja.

Kirjallisuudessa on kuitenkin muita määritelmiä. Esimerkiksi Fleiss ( Tilastolliset menetelmät nopeuksille ja mittasuhteille ) tarjoaa seuraavaa:

  • “[…] väärien positiivisten prosenttiosuus […] on niiden ihmisten osuus positiivisesti vastanneista, jotka ovat tosiasiallisesti vapaita taudista. ”
  • ” Väärän negatiivisen prosenttiosuus […] on ihmisten osuus vastanneiden joukossa. negatiivinen testi, jolla on kuitenkin sairaus. ”

(Hän myös tunnustaa edelliset määritelmät, mutta pitää niitä” arvokkaan terminologian tuhlaavina ”, juuri siksi, että heillä on suora suhde herkkyyteen ja spesifisyys.)

Viitaten sekaannusmatriisiin, se tarkoittaa, että $ FPR = FP / (TP + FP) $ ja $ FNR = FN / (TN + FN) $, joten nimittäjät ovat rivi yhteensä. I näiden määritelmien mukaan väärän positiivisen ja väärän negatiivisen osuutta ei voida suoraan johtaa testin herkkyydestä ja spesifisyydestä. Sinun on myös tiedettävä esiintyvyys (ts. Kuinka usein A on kiinnostavassa populaatiossa).

Fleiss ei käytä tai määritä lauseita ”todellinen negatiivinen osuus” tai ”todellinen positiivinen osuus”, mutta jos oletamme, että nämä ovat myös ehdollisia todennäköisyyksiä tietylle testitulokselle / luokitukselle, niin @ guill11aume vastaus on oikea.

Joka tapauksessa sinun on oltava varovainen määritelmien suhteen, koska vastaukseen ei ole kiistämätöntä vastausta. kysymyksesi.

Kommentit

  • Erittäin hyvä (+1). Jatkoin heti yhtä tulkintaa, mutta olet täysin oikeassa siinä, että vaihtoehtoinen määritelmä on vakio.
  • @ gui11aume. Kiitos! Se oli tunteeni, mutta ajattelen sitä, en ole enää niin varma. Viitteitä tarkasteltaessa se voi riippua alasta (koneoppiminen vs. lääketieteellinen testaus).
  • Kokemukseni mukaan jälkimmäinen määritelmä, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) on tavallisempi.
  • Tässä ' on julkaisu eroista: link.springer. fi / article / 10.1007 / s10899-006-9025-5 # luettelo Huomaa uusi terminologia " Testaa FPR " vs. . " Ennakoiva FPR "

Vastaa

MUOKKAA: katso Gaël Lauransin tarkempi vastaus.

Jos todellinen positiivinen osuutesi on 0.25 se tarkoittaa, että joka kerta, kun soitat positiiviseksi, sinulla on todennäköisyys olla väärässä 0,75. Tämä on väärä positiivinen osuutesi. Vastaavasti joka kerta, kun soitat negatiiviseksi, sinulla on todennäköisyys olla oikeassa 0,25, mikä on todellinen negatiivinen osuutesi.

Kommentit

  • Riippuu siitä, mitä yritetään luonnehtia: testi totuuden etukäteen tiedossa tai yrittää päättää testin jälkeisestä todennäköisyydestä juuri annettujen tulosten perusteella.

Vastaa

Ei mitään, jos tällä on mitään järkeä, jos ”positiivisella” ja ”negatiivisella” ei ole merkitystä käsillä olevalle ongelmalle. Näen monia ongelmia, joissa ”positiivinen” ja ”negatiivinen” ovat mielivaltaisia pakotettuja valintoja järjestys- tai jatkuvamuuttujassa. FP, TP, sens, spec ovat hyödyllisiä vain kaikki tai ei mitään -ilmiöille.

Vastaus

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *