Was ist der Unterschied zwischen der verbleibenden Quadratsumme und den gewöhnlichen kleinsten Quadraten?

Sie sehen für mich genauso aus, aber ich bin mir nicht sicher.

Update: Rückblickend war dies kein sehr Gute Frage. OLS bezieht sich auf das Anpassen einer Zeile an Daten und RSS ist die Kostenfunktion, die OLS verwendet. Es findet die Parameter, die die mindestens Restsumme von Quadrat Fehlern. Es heißt normal in OLS bezieht sich auf die Tatsache, dass wir eine lineare Anpassung durchführen.

Antwort

Hier ist eine -Definition aus Wikipedia :

In der Statistik ist die Restquadratsumme (RSS) die Summe der Quadrate der Residuen. Sie ist ein Maß für die Diskrepanz zwischen den Daten und einem Schätzmodell; Ordinary Least Squares (OLS) ist eine Methode zur Schätzung des unbekannten Pa Parameter in einem linearen Regressionsmodell mit dem Ziel, die Unterschiede zwischen den beobachteten Antworten in einem beliebigen Datensatz und den durch die lineare Approximation der Daten vorhergesagten Antworten zu minimieren.

RSS ist also ein Maß , wie gut das Modell die Daten approximiert, während OLS ein Methode zum Erstellen eines guten Modells.

Kommentare

  • Sie haben Keine Ahnung, wie hilfreich Ihre Antwort ist!

Antwort

Gewöhnliche kleinste Quadrate (OLS)

Gewöhnliche kleinste Quadrate (OLS) sind das Arbeitspferd der Statistik. Es bietet eine Möglichkeit, komplizierte Ergebnisse zu erfassen und Verhalten (z. B. Trends) mithilfe von Linearität zu erklären. Die einfachste Anwendung von OLS ist das Anpassen einer Zeile.

Residuen

Residuen sind die beobachtbaren Fehler aus den geschätzten Koeffizienten. In gewissem Sinne sind die Residuen Schätzungen der Fehler.

Lassen Sie uns die Dinge mit dem Code R erklären:

Passen Sie zuerst a an gewöhnliche kleinste quadratische Linie von Diamantdatensätzen in der Bibliothek UsingR:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

Geben Sie hier die Bildbeschreibung ein.

Berechnen wir nun den Rest, dh die Restsumme der Quadrate: In R Sie können den Rest einfach als resid(olsline) berechnen. Zur Visualisierung berechnen wir ihn manuell:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

Geben Sie hier die Bildbeschreibung ein.

Hoffe, diese Visualisierung wird Ihre löschen Zweifel zwischen RSS & OLS

Kommentare

Antwort

In gewisser Weise OLS ist ein Modell zur Schätzung der Regressionslinie basierend auf Trainingsdaten. Während RSS ein Parameter ist, um die Genauigkeit des Modells sowohl für Test- als auch für Trainingsdaten zu kennen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.