A unidade do erro quadrático médio (RMSE)

Qual é a unidade do erro quadrático médio médio (RMSE)? Por exemplo, se obtivermos um RMSE de 47 de um modelo de regressão, o que isso significa em termos de unidade?

Comentários

  • Os erros são medidos nas mesmas unidades de sua resposta. Erros quadrados têm unidades de sua resposta ao quadrado. A raiz quadrada do erro quadrático é mais uma vez a mesma unidade da sua resposta.
  • Por exemplo: e se estivermos tentando prever a temperatura do dia seguinte, aprendendo com os dias anteriores? Isso significará que 47% de nossa previsão está correta se ' s disser que o RMSE é 47?
  • Não! Nada do que foi dito tem a ver com porcentagens. Se sua resposta (temperatura do dia seguinte) for em graus Celsius e seu RMSE for 47, então as unidades desses 47 são graus Celsius.

Resposta

Digamos que você tenha um modelo representado pela função $ f (x) $ e calcule o RMSE dos resultados em comparação com os resultados do conjunto de treinamento $ y $. s também assumem que o resultado tem alguma unidade arbitrária $ u $.

O RMSE é $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$

ou expressando as unidades explicitamente $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$

desenvolvendo esta equação você obtém (trate u como uma constante unitária que contém as unidades) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ times {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$

Noti ce que a parte à direita é uma variável adimensional multiplicada pela constante que representa a unidade arbitrária. Então, como disse @Gregor, suas unidades são as mesmas do resultado.

Comentários

  • Por exemplo: e se estivermos tentando prever uma temperatura no dia seguinte, aprendendo com os dias anteriores? Isso significará que 47% da nossa previsão está certa se ' s disser que o RMSE é 47?
  • Para aqueles que estão satisfeitos com um argumento acenando com a mão, observe que o texto root mean square error revela tudo. O erro é residual é observado $ – $ previsto. Quadrar as unidades quadradas e o enraizamento inverte isso. Tomar uma média deixa as unidades como estão. Definir o erro como $ – $ predito observado, como fez Gauss, daria o mesmo resultado.
  • O comentário de Arno ' foi respondido enfaticamente por @Gregor abaixo do original pergunta.
  • Você pode pegar a diferença percentual das duas quantidades e fazer a média ((previsto-y) / y) ou algo semelhante.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *