평범한 언어의 공분산이란 무엇입니까?

일반 언어의 공분산이란 무엇이며 종속성 , 상관 및 용어와 어떻게 연결됩니까? 반복 측정 설계와 관련하여 분산-공분산 구조 ?

댓글

답변

공분산은 한 변수의 변화가 1 초 안에 변화와 연결되는 방식을 측정 한 것입니다. 변하기 쉬운. 특히 공분산은 두 변수가 선형 적으로 연관되는 정도를 측정합니다. 그러나 두 변수가 단조롭게 관련되어 있는지에 대한 일반적인 척도로 종종 비공식적으로 사용됩니다. 여기 에 공분산에 대한 유용한 직관적 인 설명이 많이 있습니다.

공분산이 언급 한 각 용어와 어떻게 관련되어 있는지 :

(1) 상관 는 $ [-1,1] $의 값을 가져 오는 공분산. $ \ pm 1 $의 상관은 완벽한 선형 연관을 나타내고 $ 0 $는 선형 관계가 없음을 나타냅니다. 이 척도는 원래 변수의 척도 변화에 상관 관계를 불변하게 만듭니다 (Akaval이 +1의 예를 지적하고 제공함). 척도 상수는 두 변수의 표준 편차의 곱입니다.

(2) 두 변수가 인 경우 독립 , 공분산은 $ 0 $입니다. 그러나 $ 0 $의 공분산이 있다고해서 변수가 독립적임을 의미하지는 않습니다. 이 그림 (위키 백과)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ 여기에 이미지 설명 입력

는 독립적이지 않지만 공분산이 $ 0 $ 인 데이터의 여러 예제 플롯을 보여줍니다. 한 가지 중요한 특별한 경우는 두 변수가 공동으로 정규 분포를 따르는 경우입니다. 상관 관계가없는 경우에만 독립적입니다 . 또 다른 특별한 경우는 베르누이 변수 쌍이 독립적 인 경우에만 상관 관계가 없다는 것입니다 (@cardinal 덕분에).

(3) 분산 / 공분산 구조 (종종 간단히 공분산 구조 ) 반복 측정 설계의 반복 측정은 개인에 대한 반복 측정이 잠재적으로 상관 관계가 있으므로 종속적이라는 사실을 모델링하는 데 사용되는 구조를 나타냅니다. 반복 측정의 공분산 행렬 의 항목을 모델링하여 한 가지 예는 일정 분산이있는 교환 가능한 상관 구조 로, 반복되는 각 측정이 동일한 분산을 가지며 모든 측정 쌍이 동일하게 상관됨을 지정합니다. 더 나은 선택은 더 적은 상관 관계를 갖기 위해 시간상 더 멀리 떨어진 두 측정 값이 필요한 공분산 구조를 지정하는 것입니다 (예 : 자기 회귀 모델 ). 공분산 구조라는 용어는 관찰이 상호 연관 될 수있는 여러 종류의 다변량 분석 에서 더 일반적으로 발생합니다.

댓글

  • 설명이 좋습니다. 그 다음에는 흥미로운 일련의 댓글을 생성 한 귀중한 보충 자료가 이어집니다. 모두에게 감사합니다 :)!

답변

매크로의 대답은 훌륭하지만 공분산이 상관 관계와 어떻게 관련되어 있는지에 대한 요점을 더 추가합니다. 공분산은 실제로 두 변수 사이의 관계의 강도에 대해 알려주지 않지만 상관 관계는 그렇지 않습니다. 예 :

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

이제 배율을 변경하고 x와 y에 10을 곱합니다.

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

척도를 변경해도 관계의 강도가 높아져서는 안되므로 공분산을 상관 계수의 정의 인 x와 y의 표준 편차로 나누어 조정할 수 있습니다.

위의 두 경우 모두 x와 y 사이의 상관 계수는 0.98198입니다.

댓글

  • " 공분산은 ' 두 변수 간의 관계의 강도를 실제로 알려주지 않지만 상관 관계는 그렇지 않습니다."이 진술은 완전히 거짓입니다. 두 측정 값은 두 표준 편차에 의한 동일한 모듈로 스케일링입니다.
  • @DavidHeffernan, 예, 표준 편차로 스케일링하면 공분산은 관계의 강도를 알려줍니다. 그러나 공분산 측정 자체는 ' 우리에게 그것을 알려주지 않습니다.
  • @DavidHeffernan, Akavall이 말하는 것은 그렇지 않다면 ' 변수의 척도를 모르는 공분산은 관계의 강도에 대해 아무 것도 알려주지 않습니다. 기호 만 해석 할 수 있습니다.
  • 어떤 실제 상황에서 변수의 척도에 대한 좋은 추정치를 얻지 않고도 공분산을 얻을 수 있습니까?
  • 그러나 a의 척도를 이해하기 위해 항상 표준 편차를 알아야하는 것은 아닙니다. 변수와 관계의 강도. 표준화되지 않은 효과는 종종 유익합니다. 예를 들어, 훈련 과정을 통해 사람들이 평균적으로 연간 $ 10,000의 수입을 올리는 경우, '는 아마도 ar =이 있다고 말하는 것보다 효과의 강도를 더 잘 나타내는 지표 일 것입니다. .34 코스 수행과 수입 간의 상관 관계

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다