Quest-ce que la covariance en langage clair et comment est-elle liée aux termes dépendance , corrélation et structure de variance-covariance par rapport aux plans à mesures répétées?
Commentaires
- Aussi intéressant: " Comment expliqueriez-vous la covariance à quelquun qui ne comprend que la moyenne? " et " Comment expliquez-vous la différence entre corrélation et covariance? ".
Réponse
La covariance est une mesure de la façon dont les changements dans une variable sont associés aux changements dans une seconde variable. Plus précisément, la covariance mesure le degré auquel deux variables sont associées linéairement. Cependant, il est aussi souvent utilisé de manière informelle comme une mesure générale de la monotonie de deux variables. Il existe de nombreuses explications intuitives utiles de la covariance ici .
Concernant le lien entre la covariance et chacun des termes que vous avez mentionnés:
(1) Corrélation est une version mise à léchelle de covariance qui prend des valeurs en $ [- 1,1] $ avec une corrélation de $ \ pm 1 $ indiquant une association linéaire parfaite et $ 0 $ indiquant aucune relation linéaire. Cette mise à léchelle rend la corrélation invariante aux changements déchelle des variables dorigine, (ce quAkavall souligne et donne un exemple de +1). La constante déchelle est le produit des écarts types des deux variables.
(2) Si deux variables sont indépendant , leur covariance est de 0 $. Mais, avoir une covariance de $ 0 $ nimplique pas que les variables sont indépendantes. Cette figure (de Wikipedia)
$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $
montre plusieurs exemples de tracés de données qui ne sont pas indépendants, mais leurs covariances sont $ 0 $. Un cas particulier important est que si deux variables sont conjointement normalement distribuées, alors ils sont indépendants si et seulement sils ne sont pas corrélés . Un autre cas particulier est que les paires de variables bernoulli ne sont pas corrélées si et seulement si elles sont indépendantes (merci @cardinal).
(3) La structure de variance / covariance (souvent appelée simplement structure de covariance ) dans les plans de mesures répétées fait référence à la structure utilisée pour modéliser le fait que des mesures répétées sur des individus sont potentiellement corrélées (et sont donc dépendantes) – cest fait en modélisant les entrées de la matrice de covariance des mesures répétées. Un exemple est la structure de corrélation échangeable à variance constante qui spécifie que chaque mesure répétée a la même variance et que toutes les paires de mesures sont également corrélées. Un meilleur choix peut être de spécifier une structure de covariance qui nécessite que deux mesures prises plus loin dans le temps soient moins corrélées (par exemple, un modèle autorégressif ). Notez que le terme structure de covariance apparaît plus généralement dans de nombreux types d analyses multivariées où les observations peuvent être corrélées.
Commentaires
- votre explication est agréable. Il est suivi dun précieux complément qui a suscité une série intéressante de commentaires. Merci beaucoup à tous :)!
Réponse
La réponse de la macro est excellente, mais je veux ajoutez plus à un point sur la façon dont la covariance est liée à la corrélation. La covariance ne vous dit pas vraiment sur la force de la relation entre les deux variables, contrairement à la corrélation. Par exemple:
x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here
Modifions maintenant léchelle et multiplions x et y par 10
x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200
Changer léchelle ne devrait pas augmenter la force de la relation, nous pouvons donc nous ajuster en divisant les covariances par les écarts types de x et y, qui est exactement la définition du coefficient de corrélation.
Dans les deux cas ci-dessus, le coefficient de corrélation entre x et y est 0.98198
.
Commentaires
- " La covariance ne ' ne vous dit pas vraiment sur la force de la relation entre les deux variables, contrairement à la corrélation." Cette déclaration est complètement fausse. Les deux mesures sont mises à léchelle modulo identiques par les deux écarts types.
- @DavidHeffernan, oui si elle est mise à léchelle par les écarts-types, la covariance nous indique la force de la relation. Cependant, la mesure de la covariance par elle-même ne ' ne nous le dit pas.
- @DavidHeffernan, je pense que ce que dit Akavall est que si vous ne le faites pas ' si vous ne connaissez pas léchelle des variables alors la covariance ne vous dit rien sur la force de la relation – seul le signe peut être interprété.
- Dans quelle situation pratique pouvez-vous obtenir une covariance sans pouvoir également obtenir une bonne estimation de léchelle des variables?
- Cependant, il nest pas toujours nécessaire de connaître lécart type pour comprendre léchelle dun variable et donc la force dune relation. Les effets non normalisés sont souvent informatifs. Par exemple, si suivre un cours de formation amène les gens à augmenter leurs revenus en moyenne de 10 000 $ par an, cela ' est probablement une meilleure indication de la force de leffet, que de dire quil y avait ar = .34 corrélation entre le cours et le revenu.