De eenheid van Root Mean Square Error (RMSE)

Wat is de eenheid van root mean square error (RMSE)? Als we bijvoorbeeld een RMSE van 47 krijgen van een regressiemodel, wat zegt het dan in termen van eenheid?

Reacties

  • Fouten worden gemeten in dezelfde eenheden als uw reactie. Kwadratische fouten hebben eenheden van uw antwoord in het kwadraat. Vierkantswortel van de kwadratische fout is opnieuw dezelfde eenheid als uw antwoord.
  • Bijvoorbeeld: wat als we proberen de temperatuur van de volgende dag te voorspellen door te leren van de afgelopen dagen? Betekent dit dat 47% van onze voorspelling juist is als we ' s laten zeggen dat de RMSE 47 is?
  • Nee! Niets dat is gezegd, heeft iets te maken met percentages. Als je antwoord (temperatuur van de volgende dag) in graden Celsius is, en je RMSE is 47, dan is de eenheid van die 47 graden Celsius.

Antwoord

Stel dat je een model hebt dat wordt vertegenwoordigd door de functie $ f (x) $ en je berekent de RMSE van de uitkomsten vergeleken met de uitkomsten van de trainingsset $ y $. Laten ” s nemen ook aan dat de uitkomst een willekeurige eenheid $ u $ heeft.

De RMSE is $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$

of de eenheden expliciet uitdrukken $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$

als je deze vergelijking ontwikkelt, krijg je (behandel u als een unitaire constante die de eenheden bevat) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ keer {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$

Noti ce dat het deel aan de rechterkant een dimensieloze variabele is, vermenigvuldigd met de constante die de willekeurige eenheid vertegenwoordigt. Dus, zoals @Gregor zei, de eenheden zijn dezelfde als die van de uitkomst.

Opmerkingen

  • Bijvoorbeeld: wat als we proberen om een temperatuur van de volgende dag voorspellen, leren van de afgelopen dagen? Betekent dit dat 47% van onze voorspelling klopt als ' s zeggen dat de RMSE 47 is?
  • Voor degenen die tevreden zijn met een handzwaaiend argument, merk op dat de formulering root mean square error geeft het allemaal weg. Fout is residu wordt waargenomen $ – $ voorspeld. Kwadrateren van de eenheden en rooten keert dat om. Door een gemiddelde te nemen, blijven de eenheden zoals ze zijn. Het definiëren van een fout als voorspelde $ – $ waargenomen, zoals Gauss deed, zou hetzelfde resultaat opleveren.
  • Arno ' s opmerking werd nadrukkelijk beantwoord door @Gregor onder het origineel vraag.
  • U zou het procentuele verschil van de twee grootheden kunnen nemen en het gemiddelde kunnen nemen van ((voorspelde-y) / y) of iets dergelijks.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *