Jaka jest jednostka błędu średniej kwadratowej (RMSE)? Na przykład, jeśli otrzymamy RMSE równe 47 z modelu regresji, co to mówi w kategoriach jednostek?
Komentarze
- Błędy są mierzone w tych samych jednostkach co Twoja odpowiedź. Kwadratowe błędy mają jednostki odpowiedzi do kwadratu. Pierwiastek kwadratowy błędu kwadratowego ponownie jest tą samą jednostką, co Twoja odpowiedź.
- Na przykład: co zrobić, jeśli próbujemy przewidzieć temperaturę następnego dnia na podstawie poprzednich dni? Czy to oznacza, że 47% naszych przewidywań jest słusznych, gdybyśmy ' mówili, że RMSE wynosi 47?
- Nie! Nic, co zostało powiedziane, nie ma nic wspólnego z procentami. Jeśli Twoja odpowiedź (temperatura następnego dnia) jest podana w stopniach Celsjusza, a wartość RMSE wynosi 47, to jednostkami tych 47 są stopnie Celsjusza.
Odpowiedź
Powiedzmy, że masz model reprezentowany przez funkcję $ f (x) $ i obliczasz RMSE wyników w porównaniu z wynikami zestawu uczącego $ y $. Niech ” s załóżmy również, że wynik ma jakąś dowolną jednostkę $ u $.
RMSE to $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
lub wyrażając jednostki wprost $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
rozwijając to równanie otrzymujesz (potraktuj u jako stałą unitarną, która przechowuje jednostki) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ times {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce, że część po prawej stronie jest bezwymiarową zmienną pomnożoną przez stałą reprezentującą dowolną jednostkę. Tak więc, jak powiedział @Gregor, jego jednostki są takie same, jak jednostki wyniku.
Komentarze
- Na przykład: co by było, gdybyśmy przewidzieć temperaturę następnego dnia, ucząc się z ostatnich dni? Czy to oznacza, że 47% naszych przewidywań jest słusznych, jeśli pozwolimy ' powiedzieć, że RMSE wynosi 47?
- Dla tych, którzy są zadowoleni z argumentu machającego ręką, zauważ, że wyrażenie błąd średniokwadratowy wyjaśnia wszystko. Błąd jest rezydualny. Przewidywany $ – $. Kwadrat kwadratów jednostek i zakorzenienie odwraca to. Przyjęcie środka pozostawia jednostki takimi, jakie są. Zdefiniowanie błędu zgodnie z przewidywaniami $ – $ zaobserwowane, podobnie jak Gauss, dałoby ten sam wynik.
- Arno ' na komentarz odpowiedział dobitnie @Gregor poniżej oryginału pytanie.
- Możesz wziąć procentową różnicę między dwiema wielkościami i uśrednić ją ((przewidywane-y) / y) lub coś podobnego.