Care este unitatea de eroare pătrată medie rădăcină (RMSE)? De exemplu, dacă obținem un RMSE de 47 dintr-un model de regresie, ce spune în termeni de unitate?
Comentarii
- Erorile sunt măsurate în aceleași unități ca răspunsul dvs. Erorile pătrate au unități ale răspunsului dvs. la pătrat. Rădăcina pătrată a erorii pătrate este din nou aceeași unitate cu răspunsul dvs.
- De exemplu: ce se întâmplă dacă încercăm să prezicem o temperatură a zilei următoare învățând din zilele trecute? Va însemna acest lucru 47% din predicția noastră este corectă dacă ' s spunem că RMSE este 47?
- Nu! Nimic din cele spuse nu are legătură cu procentele. Dacă răspunsul dvs. (temperatura zilei următoare) este în grade Celsius, iar RMSE este 47, atunci unitățile acelui 47 sunt grade Celsius.
Răspuns
Să „spunem că aveți un model reprezentat de funcția $ f (x) $ și calculați RMSE a rezultatelor în comparație cu rezultatele stabilite de antrenament $ y $. Să” De asemenea, presupunem că rezultatul are o unitate arbitrară $ u $.
RMSE este $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
sau exprimarea explicită a unităților $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
dezvoltând această ecuație obțineți (tratați-o ca pe o constantă unitară care deține unitățile) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ times {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti că partea din dreapta este o variabilă adimensională înmulțită cu constanta care reprezintă unitatea arbitrară. Deci, așa cum a spus @Gregor, unitățile sale sunt aceleași cu cele ale rezultatului.
Comentarii
- De exemplu: ce se întâmplă dacă încercăm să prezice o temperatură a zilei următoare învățând din zilele trecute? Va însemna acest lucru 47% din predicția noastră este corectă dacă ' s spunem că RMSE este 47?
- Pentru cei mulțumiți de un argument care flutură mâna, rețineți că formularea rădăcină înseamnă eroare pătrată oferă totul. Se observă o eroare reziduală $ – $ prezisă. Patratarea pătratelor unităților și înrădăcinarea inversează acest lucru. A lua o medie lasă unitățile așa cum sunt. Definirea erorii așa cum s-a prevăzut $ – $ observat, așa cum a făcut Gauss, ar da același rezultat.
- Comentariul lui Arno ' a primit un răspuns categoric de @Gregor sub original întrebare.
- Ați putea lua diferența procentuală dintre cele două cantități și să o mediați ((predicted-y) / y) sau ceva similar.