Zajímalo by mě, jestli by někdo mohl vysvětlit rozdíl mezi vyváženou přesností, která je
b_acc = (sensitivity + specificity)/2
a skóre f1, které je:
f1 = 2*precision*recall/(precision + recall)
odpověď
Matematicky b_acc je aritmetický průměr recall_P a recall_N a f1 je harmonický průměr recall_P a přesnosti_P.
F1 i b_acc jsou metriky pro hodnocení klasifikátoru, které (do určité míry) zvládají třídu nerovnováha. V závislosti na tom, která ze dvou tříd (N nebo P) převyšuje druhou, každá metrika překonává druhou.
1) Pokud N >> P, f1 je lepší.
2) Pokud je P >> N, b_acc je lepší.
Je zřejmé, že pokud můžete přepnout označení, lze obě metriky použít v kterémkoli ze dvou výše uvedených případů nevyváženosti. Pokud ne, pak v závislosti na nerovnováze v tréninkových datech můžete vybrat příslušnou metriku.
Komentáře
- Děkuji vám, pane, máte odkaz na informace týkající se výběru Fscore vs vyvážené přesnosti, pokud jde o počet pozitivních / negativních tříd?
- Chtěl bych sekundovat požadavek @gin ' na více informací o tom, jak si vybrat mezi těmito dvěma. Mám nějaké údaje, že kde N je asi 8%. Odpověď výše se zdá, že bych měl použít vyváženou přesnost. ' Hledal jsem další odkazy na tuto volbu (P > N – > b_acc), ale ' jsem nic neviděl.
- To mi nedává žádný smysl '. Vyvážená přesnost je při přepínání štítků neměnná. Jak můžete " vylepšit " přepínáním štítků, pokud se nezmění?
- @TCProctor Může vyvážená změna přesnosti v pořadí vzhledem k F1 vzhledem k přepnutí štítku?