Sie sehen für mich genauso aus, aber ich bin mir nicht sicher.
Update: Rückblickend war dies kein sehr Gute Frage. OLS bezieht sich auf das Anpassen einer Zeile an Daten und RSS ist die Kostenfunktion, die OLS verwendet. Es findet die Parameter, die die mindestens Restsumme von Quadrat Fehlern. Es heißt normal in OLS bezieht sich auf die Tatsache, dass wir eine lineare Anpassung durchführen.
Antwort
Hier ist eine -Definition aus Wikipedia :
In der Statistik ist die Restquadratsumme (RSS) die Summe der Quadrate der Residuen. Sie ist ein Maß für die Diskrepanz zwischen den Daten und einem Schätzmodell; Ordinary Least Squares (OLS) ist eine Methode zur Schätzung des unbekannten Pa Parameter in einem linearen Regressionsmodell mit dem Ziel, die Unterschiede zwischen den beobachteten Antworten in einem beliebigen Datensatz und den durch die lineare Approximation der Daten vorhergesagten Antworten zu minimieren.
RSS ist also ein Maß , wie gut das Modell die Daten approximiert, während OLS ein Methode zum Erstellen eines guten Modells.
Kommentare
- Sie haben Keine Ahnung, wie hilfreich Ihre Antwort ist!
Antwort
Gewöhnliche kleinste Quadrate (OLS)
Gewöhnliche kleinste Quadrate (OLS) sind das Arbeitspferd der Statistik. Es bietet eine Möglichkeit, komplizierte Ergebnisse zu erfassen und Verhalten (z. B. Trends) mithilfe von Linearität zu erklären. Die einfachste Anwendung von OLS ist das Anpassen einer Zeile.
Residuen
Residuen sind die beobachtbaren Fehler aus den geschätzten Koeffizienten. In gewissem Sinne sind die Residuen Schätzungen der Fehler.
Lassen Sie uns die Dinge mit dem Code R
erklären:
Passen Sie zuerst a an gewöhnliche kleinste quadratische Linie von Diamantdatensätzen in der Bibliothek UsingR
:
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
Berechnen wir nun den Rest, dh die Restsumme der Quadrate: In R
Sie können den Rest einfach als resid(olsline)
berechnen. Zur Visualisierung berechnen wir ihn manuell:
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Hoffe, diese Visualisierung wird Ihre löschen Zweifel zwischen RSS & OLS
Kommentare
- Referenz: Coursera Reg ression Models Klasse , ich habe sie kürzlich abgeschlossen.
Antwort
In gewisser Weise OLS ist ein Modell zur Schätzung der Regressionslinie basierend auf Trainingsdaten. Während RSS ein Parameter ist, um die Genauigkeit des Modells sowohl für Test- als auch für Trainingsdaten zu kennen.