Vad är enheten för rotmedelvärde kvadratfel (RMSE)? Till exempel om vi får en RMSE på 47 från en regressionsmodell, vad säger den när det gäller enhet?
Kommentarer
- Fel mäts i samma enheter som ditt svar. Kvadratfel har enheter av ditt svar i kvadrat. Kvadratrot av kvadratfel är återigen samma enhet som ditt svar.
- Till exempel: vad händer om vi försöker förutse en temperatur nästa dag som lär oss från de senaste dagarna? Kommer det att betyda 47% av vår förutsägelse är rätt om ' säger att RMSE är 47?
- Nej! Inget som har sagts har något att göra med procentsatser. Om ditt svar (temperaturen nästa dag) är i grader Celsius och din RMSE är 47, så är enheterna på dessa 47 grader Celsius.
Svar
Låt oss säga att du har en modell som representeras av funktionen $ f (x) $ och du beräknar RMSE för resultaten jämfört med utbildningsresultaten $ y $. Låt ” antar också att resultatet har någon godtycklig enhet $ u $.
RMSE är $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
eller uttryckligen uttrycka enheterna $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
utveckla denna ekvation du får (behandla u som en enhetskonstant som håller enheterna) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ gånger {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti se att delen till höger är en dimensionslös variabel multiplicerad med konstanten som representerar den godtyckliga enheten. Så som @Gregor sa, dess enheter är desamma som för resultatet.
Kommentarer
- Till exempel: vad händer om vi försöker förutsäga en temperatur nästa dag att lära av de senaste dagarna? Kommer det att innebära att 47% av vår förutsägelse är rätt om låt ' säger att RMSE är 47?
- För de som är nöjda med ett handvinkande argument, notera att formuleringen root betyder kvadratfel ger allt bort. Felet är kvar observeras $ – $ förutsagt. Kvadrering kvadrerar enheterna och rotering vänder det. Att ta ett medel lämnar enheterna som de är. Att definiera fel som förutsagt $ – $ observerat, som Gauss gjorde, skulle ge samma resultat.
- Arno ' s kommentar besvarades med eftertryck av @Gregor under originalet fråga.
- Du kan ta skillnaden i procent av de två kvantiteterna och genomsnittliga det betyder ((förutsagt-y) / y) eller något liknande.