De ser ut som samma sak för mig men jag är inte säker.
Uppdatering: i efterhand var det inte så mycket bra fråga. OLS hänvisar till att anpassa en rad till data och RSS är den kostnadsfunktion som OLS använder. Den hittar de parametrar som ger minst restsumma av kvadrat fel. Det kallas vanligt i OLS hänvisar till det faktum att vi gör en linjär passning.
Svar
Här är en definition från Wikipedia :
I statistiken är restsumman av kvadrater (RSS) summan av kvadraterna av restmängder. Det är ett mått på skillnaden mellan data och en uppskattningsmodell; Vanliga minsta kvadrater (OLS) är en metod för att uppskatta okänd pa rameters i en linjär regressionsmodell, med målet att minimera skillnaderna mellan de observerade svaren i någon godtycklig dataset och svaren som förutses av den linjära approximationen av data.
Så RSS är ett mått av hur bra modellen approximerar data medan OLS är en metod för att konstruera en bra modell.
Kommentarer
- Du har ingen aning om hur bra ditt svar är!
Svar
Vanliga minsta kvadrater (OLS)
Vanliga minsta kvadrater (OLS) är statistikens arbetshäst. Det ger ett sätt att ta komplicerade resultat och förklara beteende (som trender) med linjäritet. Den enklaste tillämpningen av OLS passar en linje.
Restprodukter
Restprodukter är de observerbara felen från de uppskattade koefficienterna. På ett sätt är resterna uppskattningar av felen.
Låt oss förklara sakerna med R
-kod:
Anpassa först en vanlig minst kvadratrad av diamantuppsättningar i UsingR
bibliotek:
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
Nu, låt oss beräkna den återstående dvs restsumman av kvadrater: I R
du kan enkelt beräkna rest som resid(olsline)
, för visualisering kan vi beräkna det manuellt:
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Hoppas att denna visualisering kommer att rensa din tvivel mellan RSS & OLS
Kommentarer
- Referens: Coursera Reg ression Models class , jag har nyligen slutfört den.
Svar
På ett sätt, OLS är en modell för att uppskatta regressionslinjen baserat på träningsdata. Medan RSS är en parameter för att känna till noggrannheten i modellen för både test- och träningsdata.