Care este diferența dintre suma reziduală de pătrate și cele mai mici pătrate obișnuite?

Mi se pare același lucru, dar nu sunt sigur.

Actualizare: retrospectiv, acest lucru nu a fost foarte întrebare bună. OLS se referă la adaptarea unei linii la date și RSS este funcția de cost pe care OLS o folosește. Acesta găsește parametrii care oferă cel mai puțin suma reziduală a pătrat erori. Se numește obișnuit în OLS se referă la faptul că facem o potrivire liniară.

Răspuns

Iată o definiție din Wikipedia :

În statistici, suma reziduală a pătratelor (RSS) este suma pătratelor reziduurilor. Este o măsură a discrepanței dintre date și o model de estimare; Cele mai mici pătrate obișnuite (OLS) este o metodă pentru estimarea pa necunoscut rametere într-un model de regresie liniară, cu scopul de a minimiza diferențele dintre răspunsurile observate în unele seturi de date arbitrare și răspunsurile prezise de aproximarea liniară a datelor.

Deci RSS este o măsură a cât de bun modelul aproximează datele în timp ce OLS este un metoda de construire a unui model bun.

Comentarii

  • Aveți nicio idee cât de util este răspunsul dvs.!

Răspuns

Cele mai mici pătrate obișnuite (OLS)

Cele mai mici pătrate obișnuite (OLS) este calul statisticilor. Oferă o modalitate de a lua rezultate complicate și de a explica comportamentul (cum ar fi tendințele) folosind linearitatea. Cea mai simplă aplicație a OLS este potrivirea unei linii.

Residuals

Residuals sunt erorile observabile din coeficienții estimate. Într-un sens, reziduurile sunt estimări ale erorilor.

Să explicăm lucrurile folosind codul R:

Mai întâi potriviți un linie obișnuită cel puțin pătrată de seturi de date cu diamante din UsingR bibliotecă:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

introduceți descrierea imaginii aici

Acum, Să calculăm suma reziduală adică reziduală a pătratelor: În R puteți calcula cu ușurință reziduul ca resid(olsline), pentru vizualizare să îl calculăm manual:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

introduceți descrierea imaginii aici

Sper că aceste vizualizări vă vor șterge îndoieli între RSS & OLS

Comentarii

Răspuns

Într-un fel, OLS este un model pentru estimarea liniei de regresie pe baza datelor de instruire. În timp ce, RSS este un parametru pentru a cunoaște acuratețea modelului atât pentru testare, cât și pentru datele de instruire.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *