回帰方程式の正と負のベータ重みの解釈

この基本的な質問をメールで受け取りました:

回帰方程式では、ベータ値が正の場合、独立変数の使用が増えると従属変数が増加し、負の場合、従属変数が増加するのに応じて減少すると考えるのは正しいですか。独立変数-相関を読み取る方法と似ていますか?

コメント

  • @Jeromy、ベータの重みとは、線形回帰係数を意味しますか?
  • @mp従来、ベータはすべての変数が標準化されたときの係数です。 (これにより、すぐに偏相関として認識され、質問に答えられるはずです… 🙂
  • @ayush初歩的な質問だと思いますので、ご自身で答えないでください。ただし、このサイトはさまざまな難易度で質問をすることでメリットが得られると思います。 'いくつかの一般的な問題を取り上げた回答の機会を他の人に与えた後、自分の回答を追加したいと思います。
  • 良い点、@ Jeromy。 ' @ayushがそのようなコメントを提供しなかったと確信しています(失礼またはさらに悪いと簡単に誤解される可能性があります)は、新しいユーザーが提起するのと同じ質問でした。 'がこれをここでのあなたの高い評判の証としてとらえ、いずれかの返信が特派員を啓発するのに役立つかどうかを確認しましょう。
  • @whuber。いい視点ね。心理学の統計コンサルタントである私は、かなり初歩的な質問をメールで受け取ることがあります。私の理想的な状況は、そのような学生にここに直接投稿するように勧めることです。一般的に、私は学生に電子メールで返信するよりも、このサイトでこれらの質問に答えることを好みます。そうすれば、私の回答はインターネットの継続的なリソースになる可能性があり、他の人はさらに良い回答を思い付く可能性があります。

回答

回帰係数の意味を説明する上で、次の説明が非常に役立つことがわかりました。回帰があるとします

$$ Y = a + bX $$

$ X $が$ \ Delta X $で変化し、$ Y $が$ \ Delta Y $で変化するとします。 。線形関係があるので

$$ Y + \ Delta Y = a + b(X + \ Delta X)$$

$ Y = a + bX $なので、次のようになります。

$$ \ Delta Y = b \ DeltaX。$$

これがあると、$ b $が正の場合、$ X $の正の変化が結果として生じることが簡単にわかります。 $ Y $のプラスの変化。 $ b $が負の場合、$ X $の正の変化は、$ Y $の負の変化になります。

注:私はこの質問を教育的な質問として扱いました。つまり、簡単な説明を提供します。

注2: @whuberが指摘しているように、この説明には、$ X $と$ Y $のすべての可能な値に対して関係が成り立つという重要な仮定があります。実際には、これは非常に制限的な仮定ですが、テイラーの定理は微分可能関数として表現できる関係を示しているため、説明は$ \ Delta X $の小さな値に対して有効です(これは合理的な仮定です) )ローカルで線形です。

コメント

  • …動作が$ X $値の全範囲で真に線形であると仮定します! (より慎重な答えは、平均の変化に関して同じ考えを覆し、関係が因果関係にあることを示唆するヒントを回避する可能性があります。)
  • @whuber、最高の言葉は賢明な選択ではありませんでした:)コメントありがとうございます。'答えを言い換えようとします。
  • @mp "最高の"は必ずしも問題ではありません'。私は'あなたに苦労を与えようとしているだけです:-)(しかし"誘導"は私の注意を引きました…)'本当に"最高の"の説明ですが、初心者の間でよくある混乱のポイントは、相互作用係数の解釈方法です。結局のところ、'は独立して(たとえば)$ XY $を変更できます。これを行うには、$ X $または$ Y $、あるいはその両方を変更します。したがって、その状況を処理する説明は大歓迎です。
  • @whuber、はい、誘導は悪い選択でした。 '相互作用の用語の説明は他の人に任せます:)
  • @mp re注2:ああ、テイラー' sの定理!ただし、実際のデータは'連続的ではなく、区別がはるかに少なくなります。 モデルはこれらの数学的特性を享受するかもしれません。特に初心者向けの説明では、モデルの'の動作とデータに期待される動作を区別する価値があるかもしれません。また、テイラー'の定理は、ほぼ線形性が保持される$ X $値の範囲についてほとんど述べていません。回帰モデルによると、この範囲は無限です!

回答

@gungが指摘しているように、に関するさまざまな規則があります。 ($ \ beta $、つまり「ベータ」)の意味。より広範な統計文献では、ベータは標準化されていない係数を表すためによく使用されます。ただし、心理学(およびおそらく他の分野)では、標準化されていない係数のbと標準化された係数のベータが区別されることがよくあります。この回答は、ベータが標準化された係数を表していることをコンテキストが示していることを前提としています。

  • ベータの重み: @whuberが述べたように、「ベータ重み」は慣例により標準化された回帰係数です(標準化された係数についてはウィキペディアを参照)。このコンテキストでは、$ b $は標準化されていない係数に使用されることが多く、$ \ beta $は標準化された係数に使用されることがよくあります。

  • 基本的な解釈:特定の予測変数のベータ重みは、他のすべての予測変数を保持する特定の予測変数の1つの標準偏差の増加に対する標準単位の結果変数の予測差です。定数。

  • 重回帰に関する一般的なリソース:質問は初歩的ですまた、重回帰に関する一般的な資料を読む必要があることを意味します(ここにAndyFieldによる基本的な説明があります)。

  • 因果関係:「独立変数の使用が増えたことに応じて従属変数が増加した」などの表現に注意してください。 。そのような言語には因果関係があります。ベータの重みだけでは、因果関係の解釈を正当化するのに十分ではありません。因果関係の解釈を正当化するには、追加の証拠が必要になります。

コメント

  • +1ただし、統計における用語の使用に関して、異なる規則があります。たとえば、' beta ' / $ \ beta $は、データ生成プロセスを管理する真のパラメータ

'ベータハット' / $ \ hat \ beta $は、で計算された勾配推定値を指しますあなたのサンプル。この場合、変数が最初に標準化されたことを意味するものではありません。このさまざまな使用法は残念ですが、それでも現実的です。誰もが同じことを意味すると仮定するのではなく、用語に遭遇したときにその用語がどのように使用されているかを明確にすることが重要です。

  • @gung good point; 'これを組み込むために回答を更新しました。
  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です