Hvad er kovarians i almindeligt sprog?

Hvad er kovarians i almindeligt sprog, og hvordan er det knyttet til termerne afhængighed , korrelation og varians-kovarians struktur med hensyn til design med gentagne mål?

Kommentarer

Svar

Kovarians er et mål for, hvordan ændringer i en variabel er forbundet med ændringer i et sekund variabel. Specifikt måler kovarians den grad, i hvilken to variabler er lineært forbundet. Imidlertid bruges det ofte uformelt som et generelt mål for, hvor monotonisk relaterede to variabler er. Der er mange nyttige intuitive forklaringer på kovarians her .

Med hensyn til hvordan kovarians er relateret til hvert af de termer, du nævnte:

(1) Korrelation er en skaleret version af kovarians, der påtager sig værdier i $ [- 1,1] $ med en korrelation på $ \ pm 1 $, der indikerer perfekt lineær tilknytning og $ 0 $, der indikerer intet lineært forhold. Denne skalering gør korrelation uændret i ændringer i skalaen af de oprindelige variabler (som Akavall påpeger og giver et eksempel på, +1). Skaleringskonstanten er produktet af standardafvigelserne for de to variabler.

(2) Hvis to variabler er uafhængig , deres kovarians er $ 0 $. Men at have en kovarians på $ 0 $ betyder ikke, at variablerne er uafhængige. Dette tal (fra Wikipedia)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ $ indtast billedbeskrivelse her

viser flere eksempler på data, der ikke er uafhængige, men deres covariances er $ 0 $. Et vigtigt specielt tilfælde er, at hvis to variabler er sammen normalt fordelt, så er de uafhængige, hvis og kun hvis de ikke er korreleret . Et andet specielt tilfælde er, at par af bernoulli-variabler ikke er korreleret, hvis og kun hvis de er uafhængige (tak @cardinal).

(3) varians / kovariansstruktur (ofte kaldes simpelthen kovariansstruktur ) i gentagne mål design henviser til strukturen, der bruges til at modellere det faktum, at gentagne målinger på individer potentielt er korreleret (og derfor er afhængige) – dette gøres ved at modellere posterne i kovariansmatrix for de gentagne målinger. Et eksempel er udskiftelig korrelationsstruktur med konstant varians , som specificerer, at hver gentagen måling har den samme varians, og alle par af målinger er lige korrelerede. Et bedre valg kan være at specificere en kovariansstruktur, der kræver to målinger, der tages længere fra hinanden i tiden for at være mindre korreleret (f.eks. en autoregressiv model ). Bemærk, at udtrykket kovariansstruktur opstår mere generelt i mange slags multivariate analyser hvor observationer er tilladt at korrelere.

Kommentarer

  • din forklaring er god. Det efterfølges af et værdifuldt supplement, der forårsagede en interessant række kommentarer. Mange tak til alle :)!

Svar

Makros svar er fremragende, men jeg vil gerne tilføj mere til et punkt om, hvordan kovarians er relateret til korrelation. Kovarians fortæller dig ikke rigtig om styrken af forholdet mellem de to variabler, mens korrelation gør det. For eksempel:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

Lad os nu ændre skalaen og gang både x og y med 10

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

Ændring af skalaen bør ikke øge styrken af forholdet, så vi kan justere ved at dividere kovarianterne med standardafvigelser på x og y, hvilket er nøjagtigt definitionen af korrelationskoefficient.

I begge ovenstående tilfælde er korrelationskoefficienten mellem x og y 0.98198.

Kommentarer

  • " Kovarians fortæller dig ikke ' t virkelig om styrken af forholdet mellem de to variabler, mens korrelation gør det." Denne erklæring er fuldstændig falsk. De to mål er identisk modulering ved de to standardafvigelser.
  • @ DavidHeffernan, ja hvis skaleret ved standardafvigelser, fortæller kovarians os om styrken af forholdet. Kovariansmål ved sig selv fortæller os dog ikke '.
  • @DavidHeffernan, jeg tror, hvad Akavall siger, er at hvis du ikke ' ikke kender størrelsen på variablerne så fortæller kovarians dig ikke noget om forholdets styrke – kun tegnet kan fortolkes.
  • I hvilken praktisk situation kan du opnå en kovarians uden også at kunne få et godt skøn over størrelsen på variablerne?
  • Det er dog ikke altid nødvendigt at kende standardafvigelsen for at forstå skalaen for en variabel og dermed styrken af et forhold. Ikke-standardiserede effekter er ofte informative. F.eks. Hvis et træningskursus får folk til i gennemsnit at øge deres indkomst med $ 10.000 om året, er ' sandsynligvis en bedre indikation af effektens styrke end at sige, at der var ar = .34 sammenhæng mellem at gennemføre kurset og indkomst.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *