Nekem ugyanúgy néznek ki, de nem vagyok biztos benne.
Frissítés: utólag ez nem volt túl nagy jó kérdés. Az OLS egy sornak az adatokra való illesztésére utal, az RSS pedig az OLS által használt költségfüggvény. Megtalálja azokat a paramétereket, amelyek a legkevesebbet adják meg négyzet hibák maradványösszege. rendes az OLS-ben arra utal, hogy lineáris illesztést végzünk.
Válasz
Itt van egy meghatározás a Wikipédiából :
A statisztikákban a négyzetek maradványösszege (RSS) a maradványok négyzetének összege. Ez az adatok és az adatok közötti eltérés mértéke. becslési modell; A szokásos legkisebb négyzetek (OLS) az ismeretlen pa becslésének módszere rameterek lineáris regressziós modellben, azzal a céllal, hogy minimalizálják az egyes tetszőleges adatkészletben megfigyelt válaszok és az adatok lineáris közelítésével megjósolt válaszok közötti különbségeket.
Tehát az RSS egy mértéke annak, hogy mennyire közelíti meg a modell az adatokat, míg az OLS módszer egy jó modell elkészítéséhez.
Megjegyzések
- Önnek van fogalmam sincs, mennyire hasznos a válaszod!
Válasz
Közönséges legkisebb négyzetek (OLS)
A közönséges legkisebb négyzetek (OLS) a statisztikák munkagépe. Lehetőséget ad a bonyolult eredmények kimenetelére és a viselkedés (például trendek) magyarázatára a linearitás segítségével. Az OLS legegyszerűbb alkalmazása egy vonal illesztése.
Maradékok
Maradékok a becsült együtthatók megfigyelhető hibái. Bizonyos értelemben a maradványok a hibák becslései.
Magyarázzuk el a dolgokat a R
kód használatával:
Először illesszünk be egy a UsingR
könyvtár gyémánt adatkészleteinek legkisebb négyzetes sora:
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
Most számítsuk le a négyzetek maradék, azaz maradvány összegét: 81d8de1dab “>
könnyen kiszámíthatja a maradékot resid(olsline)
néven, a megjelenítéshez számítsuk ki manuálisan:
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Remélem, hogy ezek a megjelenítések megtisztítják kételyek RSS & OLS
Megjegyzések
- Hivatkozás: Coursera Reg ression Models osztály , nemrégiben befejeztem.
Válasz
Bizonyos szempontból az OLS egy modell a regressziós vonal becslésére az edzésadatok alapján. Míg az RSS egy paraméter, amely ismeri a modell pontosságát mind a tesztelés, mind az edzésadatok tekintetében.