Hva er forskjellen mellom restsummen av kvadrater og vanlige minste kvadrater?

De ser ut som det samme for meg, men jeg er ikke sikker.

Oppdatering: i ettertid var dette ikke veldig godt spørsmål. OLS refererer til å tilpasse en linje til data og RSS er kostnadsfunksjonen som OLS bruker. Den finner parametrene som gir minst restsum av kvadrat feil. Det kalles vanlig i OLS refererer til det faktum at vi gjør en lineær tilpasning.

Svar

Her er en definisjon fra Wikipedia :

I statistikken er restsummen av kvadrater (RSS) summen av kvadratene til residualene. Det er et mål på avviket mellom dataene og en estimeringsmodell; Ordinære minste kvadrater (OLS) er en metode for å estimere den ukjente pa rameters i en lineær regresjonsmodell, med målet å minimere forskjellene mellom de observerte responsene i noen vilkårlige datasett og svarene som er forutsagt av den lineære tilnærmingen av dataene.

Så RSS er et mål av hvor god modellen tilnærmer seg data mens OLS er en metode for å konstruere en god modell.

Kommentarer

  • Du har aner ikke hvor nyttig svaret ditt er!

Svar

Vanlige minste kvadrater (OLS)

Vanlige minste kvadrater (OLS) er arbeidshesten til statistikken. Det gir en måte å ta kompliserte resultater og forklare atferd (som trender) ved hjelp av linearitet. Den enkleste applikasjonen av OLS passer til en linje.

Residuals

Residuals er de observerbare feilene fra de estimerte koeffisientene. På en måte er restene estimater av feilene.

La oss forklare tingene ved hjelp av R kode:

Først må du passe en vanlig minste firkantede linje med diamantsett i UsingR bibliotek:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

skriv inn bildebeskrivelse her

Nå, la oss beregne gjenværende dvs. restsummen av firkanter: I R du kan enkelt beregne det resterende som resid(olsline), for visualisering kan vi beregne det manuelt:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

skriv inn bildebeskrivelse her

Håper denne visualiseringen vil fjerne din tviler mellom RSS & OLS

Kommentarer

Svar

På en måte, OLS er en modell for å estimere regresjonslinjen basert på treningsdata. Mens RSS er en parameter for å vite nøyaktigheten av modellen for både test- og treningsdata.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *