Hvad er enheden for root mean square error (RMSE)? For eksempel, hvis vi får en RMSE på 47 fra en regressionsmodel, hvad fortæller den med hensyn til enhed?
Kommentarer
- Fejl måles i de samme enheder som dit svar. Kvadratiske fejl har enheder af dit svar i kvadrat. Kvadratroden af den kvadrerede fejl er endnu en gang den samme enhed som dit svar.
- For eksempel: hvad hvis vi prøver at forudsige en temperatur den næste dag, der lærer de sidste dage? Vil det betyde, at 47% af vores forudsigelse er korrekt, hvis lad ' s sige, at RMSE er 47?
- Nej! Intet, der er blevet sagt, har noget med procenter at gøre. Hvis dit svar (temperatur den næste dag) er i grader Celsius, og din RMSE er 47, så er enhederne på disse 47 grader Celsius.
Svar
Lad os sige, at du har en model repræsenteret af funktionen $ f (x) $, og du beregner RMSE for resultaterne sammenlignet med træningssættets resultater $ y $. Lad ” antager også, at resultatet har en vilkårlig enhed $ u $.
RMSE er $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
eller udtrykkeligt udtrykke enheder $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
at udvikle denne ligning, du får (behandle u som en enhedskonstant, der holder enhederne) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ gange {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce at delen til højre er en dimensionsløs variabel ganget med konstanten, der repræsenterer den vilkårlige enhed. Så som @Gregor sagde, dens enheder er de samme som resultatet.
Kommentarer
- For eksempel: hvad hvis vi prøver at forudsige en temperatur på den næste dag læring fra de sidste dage? Vil det betyde, at 47% af vores forudsigelse er korrekt, hvis lad ' s sige, at RMSE er 47?
- For dem, der er tilfredse med et håndsvinkende argument, bemærk at ordlyden rod betyder kvadratfejl giver det hele væk. Fejl er resterende observeres $ – $ forudsagt. Kvadrat firkanter enhederne og rooting vender det. At tage et middel efterlader enhederne, som de er. Definition af fejl som forudsagt $ – $ observeret, som Gauss gjorde, ville give det samme resultat.
- Arno ' s kommentar blev eftertrykt besvaret af @Gregor under originalen spørgsmål.
- Du kan tage procentforskellen på de to størrelser og gennemsnitlig betyder det ((forudsagt-y) / y) eller noget lignende.