잔차 제곱합과 일반 최소 제곱의 차이점은 무엇입니까?

그것들은 저에게는 똑같은 것 같지만 확실하지 않습니다.

업데이트 : 돌이켜 보면 이것은 좋은 질문입니다. OLS는 데이터에 라인을 맞추는 것을 의미하고 RSS는 OLS가 사용하는 비용 함수입니다. 최소 정사각형 오류의 잔차 합계. 일반 는 선형 맞춤을 수행하고 있다는 사실을 나타냅니다.

답변

다음은 Wikipedia 의 정의입니다.

통계에서 잔차 제곱합 (RSS)은 잔차 제곱의 합입니다. 데이터와 데이터 사이의 불일치를 측정합니다. 추정 모델; OLS (Ordinary Minimum Squares)는 미지의 PA를 추정하는 방법입니다. 일부 임의 데이터 세트에서 관찰 된 응답과 데이터의 선형 근사에 의해 예측 된 응답 간의 차이를 최소화하는 것을 목표로하는 선형 회귀 모델의 rameters.

따라서 RSS는 OLS가 iv id = “13c5158283 인 동안 모델이 데이터에 근접하는 정도를 측정하는 측정 입니다. “>

좋은 모델을 만드는 방법

댓글

  • 답변이 얼마나 도움이되었는지 모르겠습니다.

답변

일반 최소 제곱 (OLS)

일반 최소 제곱 (OLS)은 통계의 핵심입니다. 선형성을 사용하여 복잡한 결과를 취하고 동작 (예 : 추세)을 설명하는 방법을 제공합니다. OLS의 가장 간단한 적용은 선을 맞추는 것입니다.

Residuals

Residuals 추정 된 계수에서 관찰 가능한 오류입니다. 어떤 의미에서 잔차는 오류의 추정치입니다.

R 코드를 사용하여 설명해 보겠습니다.

First fit a UsingR 라이브러리의 다이아몬드 데이터 세트의 일반적인 최소 제곱 선 :

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

여기에 이미지 설명 입력

이제 잔차, 즉 잔차 제곱합을 계산해 보겠습니다. In R 쉽게 잔차를 resid(olsline)로 계산할 수 있습니다. 시각화를 위해 수동으로 계산하겠습니다.

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

여기에 이미지 설명 입력

이 시각화가 RSS & OLS

댓글

Answer

어떤면에서는 OLS 훈련 데이터를 기반으로 회귀선을 추정하는 모델입니다. RSS는 테스트 및 학습 데이터 모두에 대한 모델의 정확성을 아는 매개 변수입니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다