Mi a különbség a négyzetek maradványösszege és a hétköznapi legkisebb négyzetek között?

Nekem ugyanúgy néznek ki, de nem vagyok biztos benne.

Frissítés: utólag ez nem volt túl nagy jó kérdés. Az OLS egy sornak az adatokra való illesztésére utal, az RSS pedig az OLS által használt költségfüggvény. Megtalálja azokat a paramétereket, amelyek a legkevesebbet adják meg négyzet hibák maradványösszege. rendes az OLS-ben arra utal, hogy lineáris illesztést végzünk.

Válasz

Itt van egy meghatározás a Wikipédiából :

A statisztikákban a négyzetek maradványösszege (RSS) a maradványok négyzetének összege. Ez az adatok és az adatok közötti eltérés mértéke. becslési modell; A szokásos legkisebb négyzetek (OLS) az ismeretlen pa becslésének módszere rameterek lineáris regressziós modellben, azzal a céllal, hogy minimalizálják az egyes tetszőleges adatkészletben megfigyelt válaszok és az adatok lineáris közelítésével megjósolt válaszok közötti különbségeket.

Tehát az RSS egy mértéke annak, hogy mennyire közelíti meg a modell az adatokat, míg az OLS módszer egy jó modell elkészítéséhez.

Megjegyzések

  • Önnek van fogalmam sincs, mennyire hasznos a válaszod!

Válasz

Közönséges legkisebb négyzetek (OLS)

A közönséges legkisebb négyzetek (OLS) a statisztikák munkagépe. Lehetőséget ad a bonyolult eredmények kimenetelére és a viselkedés (például trendek) magyarázatára a linearitás segítségével. Az OLS legegyszerűbb alkalmazása egy vonal illesztése.

Maradékok

Maradékok a becsült együtthatók megfigyelhető hibái. Bizonyos értelemben a maradványok a hibák becslései.

Magyarázzuk el a dolgokat a R kód használatával:

Először illesszünk be egy a UsingR könyvtár gyémánt adatkészleteinek legkisebb négyzetes sora:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

ide írja be a kép leírását

Most számítsuk le a négyzetek maradék, azaz maradvány összegét: 81d8de1dab “>

könnyen kiszámíthatja a maradékot resid(olsline) néven, a megjelenítéshez számítsuk ki manuálisan:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

ide írja be a kép leírását

Remélem, hogy ezek a megjelenítések megtisztítják kételyek RSS & OLS

Megjegyzések

Válasz

Bizonyos szempontból az OLS egy modell a regressziós vonal becslésére az edzésadatok alapján. Míg az RSS egy paraméter, amely ismeri a modell pontosságát mind a tesztelés, mind az edzésadatok tekintetében.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük