Qual é a diferença entre a soma residual dos quadrados e os mínimos quadrados ordinários?

Eles se parecem com a mesma coisa para mim, mas não tenho certeza.

Atualização: em retrospecto, isso não foi muito boa pergunta. OLS se refere ao ajuste de uma linha aos dados e RSS é a função de custo que o OLS usa. Ele encontra os parâmetros que fornecem o mínimo soma residual dos erros quadrados . Chama-se ordinário em OLS refere-se ao fato de que estamos fazendo um ajuste linear.

Resposta

Aqui está uma definição da Wikipedia :

Em estatísticas, a soma dos quadrados dos resíduos (RSS) é a soma dos quadrados dos resíduos. É uma medida da discrepância entre os dados e um modelo de estimativa; Mínimos quadrados ordinários (OLS) é um método para estimar o pa desconhecido parâmetros em um modelo de regressão linear, com o objetivo de minimizar as diferenças entre as respostas observadas em algum conjunto de dados arbitrário e as respostas previstas pela aproximação linear dos dados.

Portanto, RSS é uma medida de quão bom o modelo aproxima os dados enquanto OLS é método de construção de um bom modelo.

Comentários

  • Você tem não tenho ideia de como sua resposta é útil!

Resposta

Mínimos quadrados ordinários (OLS)

Mínimos quadrados comuns (OLS) é o carro-chefe das estatísticas. Fornece uma maneira de obter resultados complicados e explicar o comportamento (como tendências) usando a linearidade. A aplicação mais simples de OLS é ajustar uma linha.

Residuais

Residuais são os erros observáveis dos coeficientes estimados. Em certo sentido, os resíduos são estimativas dos erros.

Vamos explicar as coisas usando o código R:

Primeiro ajuste um linha mínima quadrada comum de conjuntos de dados de diamante na biblioteca UsingR:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

insira a descrição da imagem aqui

Agora, vamos calcular o residual, isto é, a soma residual dos quadrados: Em R você pode calcular facilmente o residual como resid(olsline), para visualização vamos calculá-lo manualmente:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

insira a descrição da imagem aqui

Espero que esta visualização limpe o seu dúvidas entre RSS & OLS

Comentários

Resposta

De certa forma, OLS é um modelo para estimar a linha de regressão com base em dados de treinamento. Embora RSS seja um parâmetro para saber a precisão do modelo para dados de teste e treinamento.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *