Vyvážená přesnost vs. skóre F-1

Zajímalo by mě, jestli by někdo mohl vysvětlit rozdíl mezi vyváženou přesností, která je

b_acc = (sensitivity + specificity)/2 

a skóre f1, které je:

f1 = 2*precision*recall/(precision + recall) 

odpověď

Matematicky b_acc je aritmetický průměr recall_P a recall_N a f1 je harmonický průměr recall_P a přesnosti_P.

F1 i b_acc jsou metriky pro hodnocení klasifikátoru, které (do určité míry) zvládají třídu nerovnováha. V závislosti na tom, která ze dvou tříd (N nebo P) převyšuje druhou, každá metrika překonává druhou.

1) Pokud N >> P, f1 je lepší.

2) Pokud je P >> N, b_acc je lepší.

Je zřejmé, že pokud můžete přepnout označení, lze obě metriky použít v kterémkoli ze dvou výše uvedených případů nevyváženosti. Pokud ne, pak v závislosti na nerovnováze v tréninkových datech můžete vybrat příslušnou metriku.

Komentáře

  • Děkuji vám, pane, máte odkaz na informace týkající se výběru Fscore vs vyvážené přesnosti, pokud jde o počet pozitivních / negativních tříd?
  • Chtěl bych sekundovat požadavek @gin ' na více informací o tom, jak si vybrat mezi těmito dvěma. Mám nějaké údaje, že kde N je asi 8%. Odpověď výše se zdá, že bych měl použít vyváženou přesnost. ' Hledal jsem další odkazy na tuto volbu (P > N – > b_acc), ale ' jsem nic neviděl.
  • To mi nedává žádný smysl '. Vyvážená přesnost je při přepínání štítků neměnná. Jak můžete " vylepšit " přepínáním štítků, pokud se nezmění?
  • @TCProctor Může vyvážená změna přesnosti v pořadí vzhledem k F1 vzhledem k přepnutí štítku?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *