Wat is covariantie in gewone taal en hoe is het gekoppeld aan de termen afhankelijkheid , correlatie en variantie-covariantiestructuur met betrekking tot ontwerpen met herhaalde metingen?
Opmerkingen
- Ook interessant: " Hoe zou u covariantie uitleggen aan iemand die alleen het gemiddelde begrijpt? " en " Hoe zou u het verschil tussen correlatie en covariantie verklaren? ".
Answer
Covariantie is een maatstaf voor hoe veranderingen in een variabele worden geassocieerd met veranderingen in een seconde variabele. Concreet meet covariantie de mate waarin twee variabelen lineair met elkaar zijn geassocieerd. Het wordt echter ook vaak informeel gebruikt als een algemene maatstaf voor hoe monotoon gerelateerd twee variabelen zijn. Er zijn hier veel nuttige intuïtieve verklaringen van covariantie.
Met betrekking tot hoe covariantie gerelateerd is aan elk van de termen die u noemde:
(1) Correlatie is een geschaalde versie van covariantie die waarden aanneemt in $ [- 1,1] $ met een correlatie van $ \ pm 1 $ die een perfecte lineaire associatie aangeeft en $ 0 $ die aangeeft dat er geen lineaire relatie is. Deze schaalvergroting maakt de correlatie onveranderlijk voor schaalveranderingen van de oorspronkelijke variabelen (waarop Akavall wijst en een voorbeeld geeft van +1). De schaalconstante is het product van de standaarddeviaties van de twee variabelen.
(2) Als twee variabelen zijn onafhankelijk , hun covariantie is $ 0 $. Maar een covariantie van $ 0 $ betekent niet dat de variabelen onafhankelijk zijn. Deze figuur (van Wikipedia)
$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $
toont verschillende voorbeeldplots van gegevens die niet onafhankelijk zijn, maar hun covarianties zijn $ 0 $. Een belangrijk speciaal geval is dat als twee variabelen gezamenlijk normaal verdeeld zijn, dan zijn ze onafhankelijk als en slechts als ze niet gecorreleerd zijn . Een ander speciaal geval is dat paren van bernoulli-variabelen niet gecorreleerd zijn als en alleen als ze onafhankelijk zijn (bedankt @cardinal).
(3) De variantie / covariantiestructuur (vaak gewoon de covariantiestructuur ) in ontwerpen met herhaalde metingen verwijst naar de structuur die wordt gebruikt om het feit te modelleren dat herhaalde metingen aan individuen mogelijk gecorreleerd zijn (en daarom afhankelijk zijn) – dit wordt gedaan door de items in de covariantiematrix van de herhaalde metingen te modelleren. Een voorbeeld is de uitwisselbare correlatiestructuur met constante variantie die specificeert dat elke herhaalde meting dezelfde variantie heeft en dat alle paren metingen gelijkelijk gecorreleerd zijn. Een betere keuze kan zijn om een covariantiestructuur te specificeren waarvoor twee metingen die verder van elkaar verwijderd zijn in de tijd nodig zijn om minder gecorreleerd te zijn (bijv. een autoregressief model ). Merk op dat de term covariantiestructuur algemener voorkomt in vele soorten multivariate analyses waarbij waarnemingen mogen worden gecorreleerd.
Reacties
- je uitleg is leuk. Het wordt gevolgd door een waardevolle aanvulling die een interessante reeks commentaren opleverde. Heel erg bedankt :)!
Antwoord
Macro “s antwoord is uitstekend, maar ik wil voeg meer toe aan een punt van hoe covariantie gerelateerd is aan correlatie. Covariantie zegt je niet echt over de sterkte van de relatie tussen de twee variabelen, terwijl correlatie dat wel doet. Bijvoorbeeld:
x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here
Laten we nu de schaal veranderen, en x en y vermenigvuldigen met 10
x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200
Het veranderen van de schaal mag de sterkte van de relatie niet vergroten, dus we kunnen aanpassen door de covarianties te delen door de standaarddeviaties van x en y, wat precies de definitie is van correlatiecoëfficiënt.
In beide bovenstaande gevallen is de correlatiecoëfficiënt tussen x en y 0.98198
.
Opmerkingen
- " Covariantie zegt ' niet echt over de sterkte van de relatie tussen de twee variabelen, terwijl correlatie dat wel doet." Die bewering is volledig onjuist. De twee maten zijn identiek modulo-schaling door de twee standaarddeviaties.
- @DavidHeffernan, ja, indien geschaald door standaarddeviaties, dan vertelt covariantie ons over de sterkte van de relatie. Echter, covariantiemeting op zichzelf zegt ' ons dat niet.
- @DavidHeffernan, ik denk dat Akavall zegt dat als je niet ' ken de schaal van de variabelen en covariantie zegt niets over de sterkte van de relatie – alleen het teken kan worden geïnterpreteerd.
- In welke praktische situatie kun je een covariantie verkrijgen zonder ook een goede schatting te kunnen maken van de schaal van de variabelen?
- Het is echter niet altijd nodig om de standaarddeviatie te kennen om de schaal van een variabel en daarmee de sterkte van een relatie. Ongestandaardiseerde effecten zijn vaak informatief. Als het volgen van een training er bijvoorbeeld voor zorgt dat mensen hun inkomen gemiddeld met $ 10.000 per jaar verhogen, is ' waarschijnlijk een betere indicatie van de sterkte van het effect dan te zeggen dat er ar = .34 verband tussen het volgen van de cursus en het inkomen.