Vypadají pro mě stejně, ale nejsem si jistý.
Aktualizace: zpětně to nebylo moc dobrá otázka. OLS odkazuje na přizpůsobení řádku datům a RSS je nákladová funkce, kterou OLS používá. Najde parametry, které poskytují nejméně zbytkový součet čtvercových chyb. Nazývá se obyčejný v OLS odkazuje na skutečnost, že děláme lineární přizpůsobení.
Odpověď
Zde je definice z Wikipedie :
Ve statistikách je zbytkový součet čtverců (RSS) součet čtverců reziduí. Jde o míru nesouladu mezi údaji a model odhadu; Obyčejné nejmenší čtverce (OLS) je metoda pro odhad neznámého pa rametry v lineárním regresním modelu s cílem minimalizovat rozdíly mezi pozorovanými odpověďmi v libovolném souboru dat a odpověďmi předpovídanými lineární aproximací dat.
Takže RSS je měřítkem toho, jak dobrý model aproximuje data, zatímco OLS je metoda konstrukce dobrého modelu.
Komentáře
- Máte vůbec nevíte, jak užitečná je vaše odpověď!
Odpověď
Obyčejné nejmenší čtverce (OLS)
Obyčejné nejmenší čtverce (OLS) jsou tahounem statistik. Poskytuje způsob, jak brát komplikované výsledky a vysvětlit chování (například trendy) pomocí linearity. Nejjednodušší aplikací OLS je přizpůsobení řádku.
Zbytky
Zbytky jsou pozorovatelné chyby z odhadovaných koeficientů. V jistém smyslu jsou zbytky odhady chyb.
Pojďme vysvětlit věci pomocí kódu R
:
Nejprve se hodí obyčejná nejméně čtvercová řada datových sad diamantů v UsingR
knihovně:
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
Nyní vypočítáme zbytkový, tj. zbytkový součet čtverců: V R
můžete zbytek snadno vypočítat jako resid(olsline)
, pro vizualizaci to spočítáme ručně:
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Doufám, že tato vizualizace vymaže vaše pochybnosti mezi RSS & OLS
Komentáře
- Odkaz: Coursera Reg třídu ression Models , nedávno jsem ji dokončil.
Odpovědět
Svým způsobem OLS je model pro odhad regresní přímky na základě tréninkových dat. Zatímco RSS je parametr, který zná přesnost modelu jak pro testování, tak pro tréninková data.