残差平方和と通常の最小二乗の違いは何ですか?

私には同じように見えますが、よくわかりません。

更新:振り返ってみると、これはあまり重要ではありませんでした。良い質問です。OLSはデータに線を当てはめることを指し、RSSはOLSが使用するコスト関数です。最小 square エラーの残差平方和。通常

は、線形近似を行っているという事実を指します。

回答

こちらがの定義です。ウィキペディア

統計では、残差二乗和(RSS)は、残差二乗の合計です。これは、データとデータの間の不一致の尺度です。推定モデル;通常最小二乗(OLS)は、未知のpaを推定する方法です。任意のデータセットで観測された応答と、データの線形近似によって予測された応答との差を最小限に抑えることを目的とした、線形回帰モデルのラメータ。

したがって、RSSは測定値であり、OLSは優れたモデルを構築する方法

コメント

  • 答えがどれほど役立つかわかりません!

答え

通常の最小二乗(OLS)

通常の最小二乗(OLS)は統計の主力です。線形性を使用して、複雑な結果を取得し、動作(傾向など)を説明する方法を提供します。 OLSの最も単純なアプリケーションは、線を当てはめることです。

残差

残差推定された係数からの観測可能な誤差です。ある意味で、残差は誤差の推定値です。

Rコードを使用して説明しましょう。

最初に適合UsingRライブラリ内のダイヤモンドデータセットの通常の最小二乗線:

library(UsingR) data("diamond") y <- diamond$price x <- diamond$carat n <- length(y) olsline <- lm(y ~ x) plot(x, y, main ="Odinary Least square line", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) 

ここに画像の説明を入力

次に、残差、つまり残差二乗和を計算しましょう。残差をresid(olsline)として簡単に計算できます。視覚化のために、手動で計算しましょう:

# The residuals from R method e <- resid(olsline) ## Obtain the residuals manually, get the predicated Ys first yhat <- predict(olsline) # The residuals are y -yhat, Let"s check by comparing this with R"s build in resid function ce <- y - yhat max(abs(e-ce)) ## Let"s do it again hard coding the calculation of Yhat max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x))) # Residuals arethe signed length of the red lines plot(diamond$carat, diamond$price, main ="Residuals sum of (actual Y - predicted Y)^2", xlab = "Mass (carats)", ylab = "Price (SIN $)", bg = "lightblue", col = "black", cex = 2, pch = 21,frame = FALSE) abline(olsline, lwd = 2) for (i in 1 : n) lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2) 

ここに画像の説明を入力

これらの視覚化により、 RSS & OLS

コメント

回答

ある意味、OLSは、トレーニングデータに基づいて回帰直線を推定するためのモデルです。一方、RSSは、テストデータとトレーニングデータの両方のモデルの精度を知るためのパラメータです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です