A me sembrano la stessa cosa ma non ne sono sicuro.
Aggiornamento: in retrospettiva, questo non era un bella domanda. OLS si riferisce alladattamento di una linea ai dati e RSS è la funzione di costo utilizzata da OLS. Trova i parametri che forniscono il minimo somma residua degli errori quadrati . Si chiama ordinario in OLS si riferisce al fatto che stiamo eseguendo un adattamento lineare.
Risposta
Ecco una definizione da Wikipedia :
Nelle statistiche, la somma dei quadrati dei residui (RSS) è la somma dei quadrati dei residui. È una misura della discrepanza tra i dati e un modello di stima; I minimi quadrati ordinari (OLS) è un metodo per stimare lo sconosciuto pa parametri in un modello di regressione lineare, con lobiettivo di ridurre al minimo le differenze tra le risposte osservate in alcuni set di dati arbitrari e le risposte previste dallapprossimazione lineare dei dati.
Quindi RSS è una misura di quanto è buono il modello approssima i dati mentre OLS è un metodo per costruire un buon modello.
Commenti
- Hai non ho idea di quanto sia utile la tua risposta!
Risposta
Minimi quadrati ordinari (OLS)
I minimi quadrati ordinari (OLS) sono il cavallo di battaglia della statistica. Fornisce un modo per ottenere risultati complicati e spiegare il comportamento (come le tendenze) usando la linearità. Lapplicazione più semplice di OLS è ladattamento di una linea.
Residui
Residui sono gli errori osservabili dai coefficienti stimati. In un certo senso, i residui sono stime degli errori.
Spieghiamo le cose usando il codice R
:
Prima inserisci un linea ordinaria dei set di dati a rombo della riga minima quadrata nella UsingR
libreria:
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
Ora, calcoliamo la somma residua, ovvero la somma residua dei quadrati: In R
puoi facilmente calcolare il residuo come resid(olsline)
, per la visualizzazione calcoliamolo manualmente:
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
Spero che queste visualizzazioni cancelleranno il tuo dubbi tra RSS & OLS
Commenti
- Riferimento: Coursera Reg ression Models class , lho completata di recente.
Answer
In un certo senso, OLS è un modello per stimare la retta di regressione in base ai dati di addestramento. Mentre, RSS è un parametro per conoscere la precisione del modello sia per i dati di test che per quelli di addestramento.