Qual è la differenza tra la somma residua dei quadrati e i minimi quadrati ordinari?

A me sembrano la stessa cosa ma non ne sono sicuro.

Aggiornamento: in retrospettiva, questo non era un bella domanda. OLS si riferisce alladattamento di una linea ai dati e RSS è la funzione di costo utilizzata da OLS. Trova i parametri che forniscono il minimo somma residua degli errori quadrati . Si chiama ordinario in OLS si riferisce al fatto che stiamo eseguendo un adattamento lineare.

Risposta

Ecco una definizione da Wikipedia :

Nelle statistiche, la somma dei quadrati dei residui (RSS) è la somma dei quadrati dei residui. È una misura della discrepanza tra i dati e un modello di stima; I minimi quadrati ordinari (OLS) è un metodo per stimare lo sconosciuto pa parametri in un modello di regressione lineare, con lobiettivo di ridurre al minimo le differenze tra le risposte osservate in alcuni set di dati arbitrari e le risposte previste dallapprossimazione lineare dei dati.

Quindi RSS è una misura di quanto è buono il modello approssima i dati mentre OLS è un metodo per costruire un buon modello.

Commenti

  • Hai non ho idea di quanto sia utile la tua risposta!

Risposta

Minimi quadrati ordinari (OLS)

I minimi quadrati ordinari (OLS) sono il cavallo di battaglia della statistica. Fornisce un modo per ottenere risultati complicati e spiegare il comportamento (come le tendenze) usando la linearità. Lapplicazione più semplice di OLS è ladattamento di una linea.

Residui

Residui sono gli errori osservabili dai coefficienti stimati. In un certo senso, i residui sono stime degli errori.

Spieghiamo le cose usando il codice R:

Prima inserisci un linea ordinaria dei set di dati a rombo della riga minima quadrata nella UsingR libreria:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

inserisci qui la descrizione dellimmagine

Ora, calcoliamo la somma residua, ovvero la somma residua dei quadrati: In R puoi facilmente calcolare il residuo come resid(olsline), per la visualizzazione calcoliamolo manualmente:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

inserisci qui la descrizione dellimmagine

Spero che queste visualizzazioni cancelleranno il tuo dubbi tra RSS & OLS

Commenti

Answer

In un certo senso, OLS è un modello per stimare la retta di regressione in base ai dati di addestramento. Mentre, RSS è un parametro per conoscere la precisione del modello sia per i dati di test che per quelli di addestramento.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *