平易な言語での共分散とは何ですか?

平易な言語での共分散とは何ですか。また、依存相関、および相関という用語とどのように関連していますか。反復測定の設計に関する分散共分散構造

コメント

回答

共分散は、1つの変数の変化が2番目の変数の変化とどのように関連しているかを示す尺度です。変数。具体的には、共分散は、2つの変数が線形に関連付けられている度合いを測定します。ただし、2つの変数が単調に関連していることの一般的な尺度として非公式に使用されることもよくあります。共分散ここには多くの便利で直感的な説明があります。

共分散が言及した各用語とどのように関連しているかについて:

(1) 相関 は、 $ [-1,1] $の値をとる共分散。相関は、$ \ pm 1 $は完全な線形関連を示し、$ 0 $は線形関係がないことを示します。このスケーリングにより、元の変数のスケールの変化に対して相関が不変になります(Akavallが指摘し、+ 1の例を示します)。スケーリング定数は、2つの変数の標準偏差の積です。

(2) 2つの変数がの場合独立 、それらの共分散は$ 0 $です。ただし、共分散が$ 0 $であるからといって、変数が独立しているわけではありません。この図(ウィキペディアから)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ ここに画像の説明を入力

は、独立していないデータのプロットの例をいくつか示していますが、それらの共分散は$ 0 $です。重要な特殊なケースの1つは、2つの変数が共同で正規分布している場合、です。次に、それらが無相関である場合に限り、それらは独立しています。もう1つの特殊なケースは、ベルヌーイ変数のペアが独立している場合にのみ無相関である場合です(@cardinalに感謝)。

(3) 分散/共分散構造(しばしば単に共分散構造)反復測定設計では、個人の反復測定が潜在的に相関している(したがって依存している)という事実をモデル化するために使用される構造を指します-これは行われます繰り返される測定の共分散行列のエントリをモデル化する。一例として、一定の分散を持つ交換可能な相関構造があります。これは、繰り返される各測定の分散が同じであり、測定のすべてのペアが等しく相関していることを指定します。より良い選択は、相関を少なくするために時間的に離れて行われる2つの測定を必要とする共分散構造を指定することです(例:自己回帰モデル)。共分散構造という用語は、観測値を相関させることができる多くの種類の多変量解析でより一般的に発生することに注意してください。

コメント

  • あなたの説明は素晴らしいです。続いて、興味深い一連のコメントを引き起こした貴重な補足が続きます。どうもありがとうございました:)!

回答

マクロの回答は素晴らしいですが、共分散が相関にどのように関連しているかという点にさらに追加します。共分散は、2つの変数間の関係の強さについては実際にはわかりませんが、相関は示します。例:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

次に、スケールを変更し、xとyの両方に10を掛けます

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

スケールを変更しても関係の強度が増すことはないため、共分散をxとyの標準偏差で除算することで調整できます。これは、まさに相関係数の定義です。

上記の両方の場合で、xとyの間の相関係数は0.98198です。

コメント

  • "共分散は' 2つの変数間の関係の強さについては実際にはわかりませんが、相関はあります。"そのステートメントは完全に誤りです。 2つの測定値は、2つの標準偏差による同一のモジュロスケーリングです。
  • @DavidHeffernan、はい、標準偏差によってスケーリングされた場合、共分散は関係の強さを示します。ただし、それ自体による共分散測定では、'そのことはわかりません。
  • @ DavidHeffernan、Akavallが言っているのは、そうでない場合 div id = “d6803e9b05″>

変数のスケールがわからない場合、共分散は関係の強さについて何も教えてくれません。解釈できるのは符号だけです。

  • 変数のスケールの適切な推定値を取得することもできずに、どのような実際の状況で共分散を取得できますか?
  • ただし、のスケールを理解するために標準偏差を知る必要は必ずしもありません。変数、したがって関係の強さ。標準化されていない効果は、多くの場合有益です。たとえば、トレーニングコースを実施することで、人々が平均して年間10,000ドルの収入を増やす場合、'は、ar =があったと言うよりも、効果の強さを示すのにおそらく適しています。 .34コースの実施と収入の相関関係。
  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です