Jaký je rozdíl mezi zbytkovým součtem čtverců a obyčejnými nejmenšími čtverci?

Vypadají pro mě stejně, ale nejsem si jistý.

Aktualizace: zpětně to nebylo moc dobrá otázka. OLS odkazuje na přizpůsobení řádku datům a RSS je nákladová funkce, kterou OLS používá. Najde parametry, které poskytují nejméně zbytkový součet čtvercových chyb. Nazývá se obyčejný v OLS odkazuje na skutečnost, že děláme lineární přizpůsobení.

Odpověď

Zde je definice z Wikipedie :

Ve statistikách je zbytkový součet čtverců (RSS) součet čtverců reziduí. Jde o míru nesouladu mezi údaji a model odhadu; Obyčejné nejmenší čtverce (OLS) je metoda pro odhad neznámého pa rametry v lineárním regresním modelu s cílem minimalizovat rozdíly mezi pozorovanými odpověďmi v libovolném souboru dat a odpověďmi předpovídanými lineární aproximací dat.

Takže RSS je měřítkem toho, jak dobrý model aproximuje data, zatímco OLS je metoda konstrukce dobrého modelu.

Komentáře

  • Máte vůbec nevíte, jak užitečná je vaše odpověď!

Odpověď

Obyčejné nejmenší čtverce (OLS)

Obyčejné nejmenší čtverce (OLS) jsou tahounem statistik. Poskytuje způsob, jak brát komplikované výsledky a vysvětlit chování (například trendy) pomocí linearity. Nejjednodušší aplikací OLS je přizpůsobení řádku.

Zbytky

Zbytky jsou pozorovatelné chyby z odhadovaných koeficientů. V jistém smyslu jsou zbytky odhady chyb.

Pojďme vysvětlit věci pomocí kódu R:

Nejprve se hodí obyčejná nejméně čtvercová řada datových sad diamantů v UsingR knihovně:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

zde zadejte popis obrázku

Nyní vypočítáme zbytkový, tj. zbytkový součet čtverců: V R můžete zbytek snadno vypočítat jako resid(olsline), pro vizualizaci to spočítáme ručně:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

zde zadejte popis obrázku

Doufám, že tato vizualizace vymaže vaše pochybnosti mezi RSS & OLS

Komentáře

Odpovědět

Svým způsobem OLS je model pro odhad regresní přímky na základě tréninkových dat. Zatímco RSS je parametr, který zná přesnost modelu jak pro testování, tak pro tréninková data.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *