O que é covariância em linguagem simples?

O que é covariância em linguagem simples e como ela está ligada aos termos dependência , correlação e estrutura de variância-covariância em relação a projetos de medidas repetidas?

Comentários

Resposta

Covariância é uma medida de como as mudanças em uma variável estão associadas às mudanças em um segundo variável. Especificamente, a covariância mede o grau em que duas variáveis estão linearmente associadas. No entanto, também é frequentemente usado informalmente como uma medida geral de quão monotonicamente relacionadas estão duas variáveis. Existem muitas explicações intuitivas úteis sobre covariância aqui .

Sobre como a covariância está relacionada a cada um dos termos que você mencionou:

(1) Correlação é uma versão em escala de covariância que assume valores em $ [- 1,1] $ com uma correlação de $ \ pm 1 $ indicando associação linear perfeita e $ 0 $ indicando nenhuma relação linear. Essa escala torna a correlação invariante às mudanças na escala das variáveis originais (que Akavall aponta e dá um exemplo de +1). A constante de escala é o produto dos desvios padrão das duas variáveis.

(2) Se duas variáveis forem independente , sua covariância é $ 0 $. Mas, ter uma covariância de $ 0 $ não implica que as variáveis sejam independentes. Esta figura (da Wikipedia)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ insira a descrição da imagem aqui

mostra vários gráficos de exemplo de dados que não são independentes, mas suas covariâncias são $ 0 $. Um caso especial importante é que se duas variáveis são conjuntamente normalmente distribuídas, então eles são independentes se e somente se eles não estiverem correlacionados . Outro caso especial é que os pares de variáveis bernoulli não estão correlacionados se e somente se forem independentes (obrigado @cardinal).

(3) A estrutura de variância / covariância (geralmente chamada simplesmente de estrutura de covariância ) em designs de medidas repetidas refere-se à estrutura usada para modelar o fato de que medidas repetidas em indivíduos são potencialmente correlacionadas (e, portanto, são dependentes) – isso é feito modelando as entradas na matriz de covariância das medições repetidas. Um exemplo é a estrutura de correlação intercambiável com variância constante , que especifica que cada medição repetida tem a mesma variância e todos os pares de medições são igualmente correlacionados. Uma escolha melhor pode ser especificar uma estrutura de covariância que requer duas medições feitas mais distantes no tempo para serem menos correlacionadas (por exemplo, um modelo autorregressivo ). Observe que o termo estrutura de covariância surge de forma mais geral em muitos tipos de análises multivariadas onde as observações podem ser correlacionadas.

Comentários

  • sua explicação é boa. É seguido por um suplemento valioso que causou uma série de comentários interessantes. Muito obrigado a todos :)!

Resposta

A resposta da macro é excelente, mas eu quero adicione mais a um ponto de como a covariância está relacionada à correlação. A covariância realmente não informa sobre a força da relação entre as duas variáveis, enquanto a correlação sim. Por exemplo:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

Agora vamos mudar a escala e multiplicar xey por 10

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

Mudar a escala não deve aumentar a força da relação, então podemos ajustar dividindo as covariâncias pelos desvios padrão de xey, que é exatamente a definição do coeficiente de correlação.

Em ambos os casos acima, o coeficiente de correlação entre xey é 0.98198.

Comentários

  • " Covariância não ' t realmente informa sobre a força da relação entre as duas variáveis, enquanto a correlação sim." Essa afirmação é completamente falsa. As duas medidas são dimensionamento de módulo idêntico pelos dois desvios padrão.
  • @DavidHeffernan, sim, se dimensionado por desvios padrão, então a covariância nos diz sobre a força da relação. No entanto, a medida de covariância por si mesma não ' nos diz isso.
  • @DavidHeffernan, acho que o que Akavall está dizendo é que se você não ' t conheço a escala das variáveis então a covariância não diz nada sobre a força do relacionamento – apenas o sinal pode ser interpretado.
  • Em que situação prática você pode obter uma covariância sem também ser capaz de obter uma boa estimativa da escala das variáveis?
  • No entanto, nem sempre é necessário saber o desvio padrão para entender a escala de uma variável e, portanto, a força de um relacionamento. Os efeitos não padronizados costumam ser informativos. Por exemplo, se fazer um curso de treinamento faz com que as pessoas, em média, aumentem sua renda em $ 10.000 por ano, isso ' é provavelmente uma indicação melhor da força do efeito, do que dizer que havia ar = .34 correlação entre fazer o curso e renda.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *