Hva er enheten for root mean square error (RMSE)? For eksempel hvis vi får en RMSE på 47 fra en regresjonsmodell, hva forteller den når det gjelder enhet?
Kommentarer
- Feil måles i de samme enhetene som svaret ditt. Kvadratiske feil har enheter av svaret ditt i kvadrat. Kvadratrot av kvadratfeil er nok en gang den samme enheten som svaret ditt.
- For eksempel: hva om vi prøver å forutsi en temperatur neste dag som læres fra de siste dagene? Vil dette bety at 47% av vår spådom er riktig hvis la ' s si at RMSE er 47?
- Nei! Ingenting som er sagt har noe med prosenter å gjøre. Hvis svaret ditt (temperatur neste dag) er i grader Celsius, og RMSE er 47, så er enhetene på disse 47 grader Celsius.
Svar
La oss si at du har en modell representert av funksjonen $ f (x) $, og du beregner RMSE for resultatene sammenlignet med opplæringsutfallet $ y $. La » antar også at utfallet har en vilkårlig enhet $ u $.
RMSE er $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
eller uttrykk for enhetene eksplisitt $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
å utvikle denne ligningen du får (behandle u som en enhetskonstant som holder enhetene) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ ganger {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti se at delen til høyre er en dimensjonsløs variabel multiplisert med konstanten som representerer den vilkårlige enheten. Så, som @Gregor sa, enhetene er de samme som resultatene.
Kommentarer
- For eksempel: hva om vi prøver å forutsi en temperatur neste dag læring fra de siste dagene? Vil dette bety at 47% av prediksjonen vår er riktig hvis ' sier RMSE er 47?
- For de som er fornøyd med et håndsvinkende argument, merk at ordlyden rot betyr kvadratfeil gir alt bort. Feil er rest er observert $ – $ forutsagt. Kvadrat kvadrat enhetene og rotering reverserer det. Å ta et middel etterlater enhetene som de er. Å definere feil som forutsagt $ – $ observert, slik Gauss gjorde, ville gi det samme resultatet.
- Arno ' s kommentar ble besvart ettertrykkelig av @Gregor under originalen spørsmål.
- Du kan ta prosentforskjellen på de to størrelsene og gjennomsnittlig betyr det ((spådd-y) / y) eller noe lignende.