Vad är skillnaden mellan återstående summa av kvadrater och vanliga minsta kvadrater?

De ser ut som samma sak för mig men jag är inte säker.

Uppdatering: i efterhand var det inte så mycket bra fråga. OLS hänvisar till att anpassa en rad till data och RSS är den kostnadsfunktion som OLS använder. Den hittar de parametrar som ger minst restsumma av kvadrat fel. Det kallas vanligt i OLS hänvisar till det faktum att vi gör en linjär passning.

Svar

Här är en definition från Wikipedia :

I statistiken är restsumman av kvadrater (RSS) summan av kvadraterna av restmängder. Det är ett mått på skillnaden mellan data och en uppskattningsmodell; Vanliga minsta kvadrater (OLS) är en metod för att uppskatta okänd pa rameters i en linjär regressionsmodell, med målet att minimera skillnaderna mellan de observerade svaren i någon godtycklig dataset och svaren som förutses av den linjära approximationen av data.

Så RSS är ett mått av hur bra modellen approximerar data medan OLS är en metod för att konstruera en bra modell.

Kommentarer

  • Du har ingen aning om hur bra ditt svar är!

Svar

Vanliga minsta kvadrater (OLS)

Vanliga minsta kvadrater (OLS) är statistikens arbetshäst. Det ger ett sätt att ta komplicerade resultat och förklara beteende (som trender) med linjäritet. Den enklaste tillämpningen av OLS passar en linje.

Restprodukter

Restprodukter är de observerbara felen från de uppskattade koefficienterna. På ett sätt är resterna uppskattningar av felen.

Låt oss förklara sakerna med R -kod:

Anpassa först en vanlig minst kvadratrad av diamantuppsättningar i UsingR bibliotek:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

ange bildbeskrivning här

Nu, låt oss beräkna den återstående dvs restsumman av kvadrater: I R du kan enkelt beräkna rest som resid(olsline), för visualisering kan vi beräkna det manuellt:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

ange bildbeskrivning här

Hoppas att denna visualisering kommer att rensa din tvivel mellan RSS & OLS

Kommentarer

Svar

På ett sätt, OLS är en modell för att uppskatta regressionslinjen baserat på träningsdata. Medan RSS är en parameter för att känna till noggrannheten i modellen för både test- och träningsdata.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *