Mi a négyzet alapértelmezett hibájának mértéke (RMSE)? Például, ha egy RMSE-t 47-re kapunk egy regressziós modellből, mit mond az egység?
Megjegyzések
- A hibákat a válaszoddal megegyező egységekben mérjük. A négyzethibák egységei a válaszadatok négyzete. A négyzetes hiba négyzetgyöke ismét ugyanaz, mint az Ön válasza.
- Például: mi van, ha megpróbáljuk megjósolni a következő nap hőmérsékletét az elmúlt napokból tanulva? Ez azt jelenti, hogy jóslatunk 47% -a helyes, ha ' mondjuk, hogy az RMSE 47?
- Nem! Semmi elhangzott semmi köze a százalékokhoz. Ha válasza (a következő nap hőmérséklete) Celsius fokban van, és RMSE értéke 47, akkor ennek 47 egysége Celsius fok.
Válasz
Mondjuk azt, hogy van egy modelled, amelyet a $ f (x) $ függvény képvisel, és kiszámolod az eredmények RMSE-értékét a $ y $ képzési halmaz eredményeihez képest. s azt is feltételezi, hogy az eredménynek van valamilyen tetszőleges egysége: $ u $.
Az RMSE értéke $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
vagy kifejezetten kifejezi az egységeket $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
ennek az egyenletnek a kidolgozása (kapja az u egységet, amely az egységeket tartja) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ szor {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce, hogy a jobb oldali rész dimenzió nélküli változó szorozva a tetszőleges egységet képviselő állandóval. Tehát, ahogy @Gregor mondta, egységei megegyeznek az eredményével.
Megjegyzések
- Például: mi van, ha megpróbáljuk megjósolni a következő nap hőmérsékletét az elmúlt napokból tanulva? Ez azt jelenti, hogy jóslatunk 47% -a helyes, ha ' mondjuk, hogy az RMSE 47?
- Azok számára, akik elégedettek a kézintéssel, vegye figyelembe, hogy a négyzet alapértelmezett középértéke megfogalmazás mindent elad. A hiba maradvány figyelhető meg $ – $ előrejelzéssel. Az egységek négyzetre állítása négyzettel, a gyökeresedés pedig ezt megfordítja. Ha átlagot veszünk, akkor az egységek olyanok maradnak, amilyenek. Ha a hibát definiáljuk a megjósolt $ – $ értékkel, ahogy Gauss tette, ugyanazt az eredményt kapta.
- Arno ' megjegyzésére @Gregor határozottan válaszolt az eredeti alatt kérdés.
- Megteheti a két mennyiség százalékos különbségét és az átlagát ((előrejelzett-y) / y) vagy valami hasonlót.