Was ist die Einheit des quadratischen Mittelwertfehlers (RMSE)? Wenn wir beispielsweise aus einem Regressionsmodell einen RMSE von 47 erhalten, was sagt es in Bezug auf die Einheit aus?
Kommentare
- Fehler werden in denselben Einheiten wie Ihre Antwort gemessen. Bei quadratischen Fehlern sind die Einheiten Ihrer Antwort quadratisch. Die Quadratwurzel des quadratischen Fehlers ist wieder dieselbe Einheit wie Ihre Antwort.
- Zum Beispiel: Was ist, wenn wir versuchen, eine Temperatur des nächsten Tages vorherzusagen und aus den letzten Tagen zu lernen? Bedeutet dies, dass 47% unserer Vorhersage richtig sind, wenn ' sagen, dass der RMSE 47 beträgt?
- Nein! Nichts, was gesagt wurde, hat etwas mit Prozentsätzen zu tun. Wenn Ihre Antwort (Temperatur des nächsten Tages) in Grad Celsius und Ihr RMSE 47 ist, sind die Einheiten dieser 47 Grad Celsius.
Antwort
Nehmen wir an, Sie haben ein Modell, das durch die Funktion $ f (x) $ dargestellt wird, und Sie berechnen den RMSE der Ergebnisse im Vergleich zu den Ergebnissen des Trainingssatzes $ y $. s nehmen auch an, dass das Ergebnis eine beliebige Einheit $ u $ hat.
Der RMSE ist $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
oder explizites Ausdrücken der Einheiten $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
Wenn Sie diese Gleichung entwickeln, erhalten Sie (behandeln Sie u als eine einheitliche Konstante, die die Einheiten enthält) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ()) x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ times {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce dass der Teil rechts eine dimensionslose Variable ist, multipliziert mit der Konstante, die die beliebige Einheit darstellt. Wie @Gregor sagte, sind die Einheiten dieselben wie die des Ergebnisses.
Kommentare
- Zum Beispiel: Was ist, wenn wir es versuchen? eine Temperatur des nächsten Tages vorhersagen und aus den letzten Tagen lernen? Bedeutet dies, dass 47% unserer Vorhersage richtig sind, wenn ' sagen, dass der RMSE 47 beträgt?
- Beachten Sie dies für diejenigen, die mit einem handwedelnden Argument zufrieden sind Der Wortlaut Root Mean Square Error verrät alles. Fehler ist Rest wird beobachtet $ – $ vorhergesagt. Durch Quadrieren der Einheiten und Rooten wird dies umgekehrt. Wenn Sie einen Mittelwert nehmen, bleiben die Einheiten so, wie sie sind. Das Definieren eines Fehlers wie vorhergesagt $ – $ beobachtet, wie Gauß, würde das gleiche Ergebnis liefern.
- Der Kommentar von Arno ' wurde von @Gregor unter dem Original nachdrücklich beantwortet Frage.
- Sie könnten die prozentuale Differenz der beiden Größen nehmen und sie als Mittelwert ((vorhergesagt-y) / y) oder ähnliches berechnen.