Co je jednotka chyby středního čtverce (RMSE)? Například pokud dostaneme RMSE 47 z regresního modelu, co to říká z hlediska jednotky?
Komentáře
- Chyby se měří ve stejných jednotkách jako vaše odpověď. Čtvercové chyby mají jednotky vaší odpovědi na druhou. Druhá odmocnina čtvercové chyby je opět stejnou jednotkou jako vaše odpověď.
- Například: co když se pokoušíme předpovědět teplotu následujícího dne učením se z posledních dnů? Bude to znamenat, že 47% naší predikce má pravdu, pokud řekneme ' s, že RMSE je 47?
- Ne! Nic, co bylo řečeno, nemá nic společného s procenty. Pokud je vaše reakce (teplota následujícího dne) ve stupních Celsia a váš RMSE je 47, pak jednotky této 47 jsou stupně Celsia.
Odpověď
Řekněme, že máte model reprezentovaný funkcí $ f (x) $ a vypočítáte RMSE výstupů ve srovnání s výstupy tréninkové sady $ y $. Nechť “ Předpokládejme také, že výsledek má libovolnou jednotku $ u $.
RMSE je $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
nebo výslovné vyjádření jednotek $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
vývoj této rovnice získáte (považujte u za jednotnou konstantu, která drží jednotky) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ krát {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce, že část vpravo je bezrozměrná proměnná vynásobená konstantou představující libovolnou jednotku. Jak tedy řekl @Gregor, jeho jednotky jsou stejné jako jednotky výsledku.
Komentáře
- Například: co když se snažíme předpovědět teplotu následujícího dne, poučit se z posledních dnů? Bude to znamenat, že 47% naší predikce má pravdu, pokud řekneme ' s, že RMSE je 47?
- Pro ty, kteří jsou spokojeni s argumentem mávajícím rukou, nezapomeňte formulace root mean square error dává vše pryč. Chyba je zbytková je pozorována $ – $ predikována. Srovnání druhé mocniny jednotek a zakořenění to obrátí. Když vezmeme průměr, necháme jednotky tak, jak jsou. Definování chyby podle předpovědi $ – $ pozorováno, stejně jako Gauss, by poskytlo stejný výsledek.
- Arno ' s komentář byl důrazně zodpovězen @Gregorem pod originálem Otázka.
- Můžete vzít procentuální rozdíl dvou veličin a průměrně to znamená ((predikovaný-y) / y) nebo něco podobného.