그것들은 저에게는 똑같은 것 같지만 확실하지 않습니다.
업데이트 : 돌이켜 보면 이것은 좋은 질문입니다. OLS는 데이터에 라인을 맞추는 것을 의미하고 RSS는 OLS가 사용하는 비용 함수입니다. 최소 정사각형 오류의 잔차 합계. 일반 는 선형 맞춤을 수행하고 있다는 사실을 나타냅니다.
답변
다음은 Wikipedia 의 정의입니다.
통계에서 잔차 제곱합 (RSS)은 잔차 제곱의 합입니다. 데이터와 데이터 사이의 불일치를 측정합니다. 추정 모델; OLS (Ordinary Minimum Squares)는 미지의 PA를 추정하는 방법입니다. 일부 임의 데이터 세트에서 관찰 된 응답과 데이터의 선형 근사에 의해 예측 된 응답 간의 차이를 최소화하는 것을 목표로하는 선형 회귀 모델의 rameters.
따라서 RSS는 OLS가 iv id = “13c5158283 인 동안 모델이 데이터에 근접하는 정도를 측정하는 측정 입니다. “>
좋은 모델을 만드는 방법
댓글
- 답변이 얼마나 도움이되었는지 모르겠습니다.
답변
일반 최소 제곱 (OLS)
일반 최소 제곱 (OLS)은 통계의 핵심입니다. 선형성을 사용하여 복잡한 결과를 취하고 동작 (예 : 추세)을 설명하는 방법을 제공합니다. OLS의 가장 간단한 적용은 선을 맞추는 것입니다.
Residuals
Residuals 추정 된 계수에서 관찰 가능한 오류입니다. 어떤 의미에서 잔차는 오류의 추정치입니다.
R
코드를 사용하여 설명해 보겠습니다.
First fit a UsingR
라이브러리의 다이아몬드 데이터 세트의 일반적인 최소 제곱 선 :
library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2)
이제 잔차, 즉 잔차 제곱합을 계산해 보겠습니다. In R
쉽게 잔차를 resid(olsline)
로 계산할 수 있습니다. 시각화를 위해 수동으로 계산하겠습니다.
# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)
이 시각화가 RSS & OLS
댓글
- 참조 : Coursera Reg ression Models 수업 , 최근에 수료했습니다.
Answer
어떤면에서는 OLS 훈련 데이터를 기반으로 회귀선을 추정하는 모델입니다. RSS는 테스트 및 학습 데이터 모두에 대한 모델의 정확성을 아는 매개 변수입니다.