Hvad er forskellen mellem restsummen af kvadrater og almindelige mindste kvadrater?

De ligner det samme for mig, men jeg er ikke sikker.

Opdatering: set i bakspejlet var det ikke meget godt spørgsmål. OLS henviser til tilpasning af en linje til data, og RSS er den omkostningsfunktion, som OLS bruger. Den finder de parametre, der giver mindst restsum af firkant fejl. Det kaldes almindeligt i OLS refererer til det faktum, at vi laver en lineær tilpasning.

Svar

Her er en definition fra Wikipedia :

I statistikker er restsummen af kvadrater (RSS) summen af kvadraterne af residualer. Det er et mål for forskellen mellem dataene og en estimeringsmodel; Almindelige mindste kvadrater (OLS) er en metode til estimering af den ukendte pa rameters i en lineær regressionsmodel med det formål at minimere forskellene mellem de observerede responser i et vilkårligt datasæt og svarene forudsagt af den lineære tilnærmelse af dataene.

Så RSS er et mål af, hvor god modellen tilnærmer sig data, mens OLS er en metode til konstruktion af en god model.

Kommentarer

  • Du har ingen idé om, hvor nyttigt dit svar er!

Svar

Almindelige mindste kvadrater (OLS)

Almindelige mindste kvadrater (OLS) er arbejdshesten i statistikker. Det giver en måde at tage komplicerede resultater på og forklare adfærd (såsom tendenser) ved hjælp af linearitet. Den enkleste anvendelse af OLS passer til en linje.

Restprodukter

Rester er de observerbare fejl fra de estimerede koefficienter. På en måde er resterne estimater af fejlene.

Lad os forklare tingene ved hjælp af R kode:

Først skal du tilpasse en almindelig mindst firkantet række af diamantsæt i UsingR bibliotek:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

indtast billedebeskrivelse her

Lad os nu beregne det resterende dvs. restsummen af firkanter: I R du kan nemt beregne det resterende som resid(olsline), til visualisering lad os beregne det manuelt:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

indtast billedebeskrivelse her

Håber, at denne visualisering rydder din tvivl mellem RSS & OLS

Kommentarer

Svar

På en måde, OLS er en model til estimering af regressionslinjen baseret på træningsdata. Mens RSS er en parameter til at kende nøjagtigheden af modellen til både test- og træningsdata.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *