Mi a kovariancia egyszerű nyelven?

Mi a kovariancia az egyszerű nyelvben, és hogyan kapcsolódik a függőség , korreláció és variancia-kovariancia struktúra az ismételt intézkedések tervezéséhez képest?

Megjegyzések

Válasz

A kovariancia annak mérőszáma, hogy az egy változóban bekövetkezett változások miként kapcsolódnak a másodperc változásaihoz változó. A kovariancia konkrétan azt méri, hogy két változó lineárisan kapcsolódik-e. Ugyanakkor gyakran informálisan is használják általános mérőszámként arra vonatkozóan, hogy két változó mennyire monoton kapcsolatban áll egymással. Számos hasznos intuitív magyarázat található a kovariancia itt .

Arra vonatkozóan, hogy a kovariancia hogyan kapcsolódik az Ön által említett kifejezésekhez:

(1) Korreláció a méretezett változata kovariancia, amely $ [- 1,1] $ értékeket vesz fel, $ \ pm 1 $ korrelációval, amely tökéletes lineáris asszociációt jelez, és $ 0 $, amely nem mutat lineáris kapcsolatot. Ez a méretezés a korrelációt invariánssá teszi az eredeti változók léptékében bekövetkező változásokkal szemben (erre Akavall rámutat és példát ad a +1-re). A méretezési állandó a két változó szórásának szorzata.

(2) Ha két változó független , kovarianciájuk 0 $. Ha azonban 0 USD kovariancia van, akkor ez nem jelenti azt, hogy a változók függetlenek. Ez az ábra (a Wikipédiából)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ írja ide a kép leírását

több olyan adatdiagramot mutat, amelyek nem függetlenek, de kovarianciájuk $ 0 $. Egy fontos speciális eset az, hogy ha két változó együttesen normál eloszlású, akkor csak akkor függetlenek, ha nincsenek korrelálva . Egy másik speciális eset az, hogy a bernoulli változók párjai csak akkor korrelálatlanok, ha függetlenek (köszönet @ kardinális).

(3) A variancia / kovariancia struktúra (gyakran egyszerűen a kovariancia struktúra ) az ismételt méréseknél a struktúra arra a struktúrára utal, amelyet annak modellezésére használnak, hogy az egyéneken végzett ismételt mérések potenciálisan korrelálnak (és ezért függenek) – ez az ismételt mérések kovarianciamátrix bejegyzéseinek modellezésével. Ilyen például a cserélhető korrelációs struktúra állandó varianciával , amely meghatározza, hogy minden ismételt mérésnek ugyanaz a szórása, és az összes mérési pár egyformán korrelál. Jobb választás lehet egy olyan kovariancia-struktúra megadása, amely megköveteli, hogy az időben két egymástól távolabb végzett mérés kevésbé korreláljon (pl. egy autoregresszív modell ). Ne feledje, hogy a kovariancia-struktúra kifejezés sokféle többváltozós elemzésben fordul elő, ahol a megfigyelések korrelálhatók.

megjegyzések

  • szép a magyarázatod. Értékes kiegészítés követi, amely érdekes észrevételsorozatot váltott ki. Nagyon köszönöm mindenkinek :)!

Válasz

A makró válasza kiváló, de szeretném adjon még egy pontot arról, hogy a kovariancia hogyan függ össze a korrelációval. A kovariancia nem igazán árul el a két változó kapcsolatának erősségéről, míg a korreláció igen. Például:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

Most változtassuk meg a méretarányt, és szorozzuk meg az x-et és az y-t is 10-szel

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

A skála megváltoztatása nem növelheti a kapcsolat erősségét, ezért úgy állíthatunk be, hogy a kovarianciákat elosztjuk x és y szórásokkal, ami pontosan meghatározza a korrelációs együtthatót.

Mindkét fenti esetben az x és y közötti korrelációs együttható 0.98198.

Megjegyzések

  • " A kovariancia nem ' nem árul el igazán a két változó kapcsolatának erősségéről, míg a korreláció igen." Ez az állítás teljesen hamis. A két mérték megegyezik a két szórás által megadott modulo méretezéssel.
  • @DavidHeffernan, igen, ha szórással skálázzuk, akkor a kovariancia megmondja a kapcsolat erősségét. A kovariancia mértéke önmagában azonban nem mondja el nekünk '.
  • @DavidHeffernan, azt hiszem, Akavall azt mondja, hogy ha nem ' nem ismeri a változók skáláját akkor a kovariancia nem mond semmit a kapcsolat erősségéről – csak a jel értelmezhető.
  • Milyen gyakorlati helyzetben lehet kovarianciát szerezni anélkül, hogy a változók skáláját is jó becsléssel tudnánk megszerezni?
  • Azonban nem mindig szükséges ismerni a szórást a skála megértéséhez változó és így a kapcsolat erőssége. A nem szabványosított hatások gyakran informatívak. Például, ha egy tanfolyam elvégzése miatt az emberek évente átlagosan 10 000 dollárral növelik az ottani jövedelmet, akkor ez valószínűleg jobban jelzi a hatás erősségét, mint azt mondani, .34 korreláció a tanfolyam elvégzése és a jövedelem között.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük