Arra gondoltam, hogy valaki meg tudná-e magyarázni a kiegyensúlyozott pontosság közötti különbséget, ami
b_acc = (sensitivity + specificity)/2
és az f1 pontszáma, amely a következő:
f1 = 2*precision*recall/(precision + recall)
Válasz
Matematikailag a b_acc a visszahívás_P és a visszahívás_N aritmetikai átlaga, az f1 pedig a visszahívás_P és a precíziós_P harmonikus középértéke.
Az F1 és a b_acc is az osztályozó értékelésének metrikája, amely (bizonyos mértékben) kezeli az osztályt egyensúlyhiány. Attól függően, hogy a két osztály közül melyik (N vagy P) meghaladja a másikat, mindegyik mutató felülmúlja a másikat.
1) Ha N >> P, akkor az f1 jobb.
2) Ha a P >> N, a b_acc jobb.
Nyilvánvaló, hogy ha fel tudja váltani a címkét, akkor mindkét mutató használható a fenti két egyensúlyhiány bármelyikében. Ha nem, akkor az edzésadatok egyensúlyhiányától függően kiválaszthatja a megfelelő mutatót.
Megjegyzések
- Köszönöm, uram, van utalás az Fscore és a kiegyensúlyozott pontosság kiválasztására vonatkozó információkra a pozitív / negatív osztályok számát tekintve?
- Szeretnék másodlagosan @gin ' kérelmet küldeni további információ a kettő közötti választásról. Van néhány adatom arról, hogy ahol az N körülbelül 8%. A fenti válasz alapján úgy tűnik, hogy kiegyensúlyozott pontosságot kellene használnom. <
más referenciákat kerestem erre a választásra (P > N – > b_acc), de a ' nem látott semmit.