Mikä on neliön keskivirheen (RMSE) yksikkö? Esimerkiksi jos saamme regressiomallin RMSE: n 47, mitä se kertoo yksikköinä?
Kommentit
- Virheet mitataan samoissa yksiköissä kuin vastauksesi. Neliövirheissä vastauksen yksiköt ovat neliöinä. Neliövirheen neliöjuuri on jälleen sama yksikkö kuin vastauksesi.
- Esimerkiksi: entä jos yritämme ennustaa seuraavan päivän lämpötilan oppimisen viimeisistä päivistä? Tarkoittaako tämä sitä, että 47% ennustuksestamme on oikea, jos ' sanotaan RMSE: n olevan 47?
- Ei! Mikään sanotulla ei ole mitään tekemistä prosenttien kanssa. Jos vastauksesi (seuraavan päivän lämpötila) on celsiusasteissa ja RMSE on 47, niin sen 47 yksiköt ovat celsiusasteita.
Vastaa
Sanotaan, että sinulla on malli, jota edustaa funktio $ f (x) $, ja lasket tulosten RMSE-arvon verrattuna harjoitusjoukon tuloksiin $ y $. Let ” Oletetaan myös, että tuloksella on mielivaltainen yksikkö $ u $.
RMSE on $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) – y_i) ^ 2}} $$
tai ilmaisemalla yksiköt nimenomaisesti $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {(f (x_i) [u] – y_i [u]) ^ 2}} $$
kehitettäessä tätä yhtälöä saat (käsittele u yhtenäisenä vakiona, joka pitää yksiköt) $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i) [u]) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {\ sum_i {((f ( x_i) – y_i)) ^ 2 [u] ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} \ sqrt {[u] ^ 2 \ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $$ RMSE (y) = \ frac {1} {N} [u] \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}} $$ $ $ RMSE (y) = {[u]} \ kertaa {\ frac {1} {N} \ sqrt {\ sum_i {((f (x_i) – y_i)) ^ 2}}} $$
Noti ce, että oikealla oleva osa on dimensioton muuttuja kerrottuna mielivaltaista yksikköä edustavalla vakiolla. Joten, kuten @Gregor sanoi, sen yksiköt ovat samat kuin lopputuloksessa.
Kommentit
- Esimerkiksi: entä jos yritämme ennustaa seuraavan päivän lämpötila oppimalla viime päivistä? Tarkoittaako tämä 47% ennustuksestamme olevan oikein, jos ' sanotaan RMSE: n olevan 47?
- Huomaa, että niille, jotka ovat tyytyväisiä käsin heiluttavaan väitteeseen? sanamuoto neliön keskivirhe antaa kaiken pois. Virhe on jäljellä havaitaan $ – $ ennustettu. Neliön neliöt yksiköt ja juurtuminen kääntävät sen. Keskiarvon ottaminen jättää yksiköt sellaisiksi kuin ne ovat. Virheen määrittely ennustetuksi $ – $: ksi, kuten Gauss teki, antaisi saman tuloksen.
- Arno ' kommenttiin vastasi painokkaasti @Gregor alkuperäisen alapuolella. kysymys.
- Voit ottaa prosenttieron kahdesta suureesta ja sen keskiarvosta ((ennustettu-y) / y) tai jotain vastaavaa.