¿Cuál es la unidad del error cuadrático medio (RMSE)? Por ejemplo, si obtenemos un RMSE de 47 de un modelo de regresión, ¿qué dice en términos de unidad?
Comentarios
- Los errores se miden en las mismas unidades que su respuesta. Los errores al cuadrado tienen unidades de su respuesta al cuadrado. La raíz cuadrada del error al cuadrado es una vez más la misma unidad que su respuesta.
- Por ejemplo: ¿qué pasa si estamos tratando de predecir la temperatura del día siguiente aprendiendo de los días anteriores? ¿Significa esto que el 47% de nuestra predicción es correcta si ' s digamos que el RMSE es 47?
- ¡No! Nada de lo dicho tiene nada que ver con los porcentajes. Si su respuesta (temperatura del día siguiente) está en grados Celsius y su RMSE es 47, entonces las unidades de esos 47 son grados Celsius.
Respuesta
Supongamos que tiene un modelo representado por la función $ f (x) $ y calcula el RMSE de los resultados en comparación con los resultados del conjunto de entrenamiento $ y $. Vamos » s también asume que el resultado tiene alguna unidad arbitraria $ u $.
El RMSE es $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
o expresando las unidades explícitamente $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
Al desarrollar esta ecuación, obtienes (trata a u como una constante unitaria que contiene las unidades) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ veces {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce que la parte de la derecha es una variable adimensional multiplicada por la constante que representa la unidad arbitraria. Entonces, como dijo @Gregor, sus unidades son las mismas que las del resultado.
Comentarios
- Por ejemplo: ¿qué pasa si estamos tratando de predecir la temperatura del día siguiente aprendiendo de los días anteriores? ¿Significa esto que el 47% de nuestra predicción es correcta si ' s digamos que el RMSE es 47?
- Para aquellos que estén contentos con un argumento de agitación de manos, tenga en cuenta que la redacción error cuadrático medio lo delata todo. El error es residual se observa $ – $ predice. Cuadrar las unidades al cuadrado y enraizar lo invierte. Tomar una media deja las unidades como están. Definir el error como predicho $ – $ observado, como lo hizo Gauss, daría el mismo resultado.
- Arno ' s comentario fue respondido enfáticamente por @Gregor debajo del original pregunta.
- Puede tomar la diferencia porcentual de las dos cantidades y promediar la media ((predicha-y) / y) o algo similar.