Co je kovariance v prostém jazyce a jak je spojena s pojmy závislost , korelace a variance-kovarianční struktura s ohledem na návrhy opakovaných opatření?
Komentáře
- Zajímavé také: " Jak byste vysvětlili kovarianci někomu, kdo rozumí pouze zlu? " a " Jak byste vysvětlili rozdíl mezi korelací a kovariancí? ".
Odpověď
Kovariance je měřítkem toho, jak jsou změny v jedné proměnné spojeny se změnami ve druhé proměnná. Konkrétně kovariance měří míru, do jaké jsou dvě proměnné lineárně spojeny. Často se však také používá neformálně jako obecné měřítko toho, jak monotónně související dvě proměnné jsou. zde existuje mnoho užitečných intuitivních vysvětlení kovariance.
Pokud jde o to, jak kovariance souvisí s každým z výrazů, které jste zmínili:
(1) Korelace je zmenšená verze kovariance, která přebírá hodnoty v $ [- 1,1] $ s korelací $ \ pm 1 $ označující dokonalou lineární asociaci a $ 0 $ označující žádný lineární vztah. Díky tomuto měřítku je korelace neměnná vůči změnám v měřítku původních proměnných (na které Akavall poukazuje a uvádí příklad +1). Konstanta měřítka je součinem směrodatných odchylek dvou proměnných.
(2) Pokud jsou dvě proměnné nezávislé , jejich kovariance je $ 0 $. Mít kovarianci $ 0 $ však neznamená, že proměnné jsou nezávislé. Toto číslo (z Wikipedie)
$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $
zobrazuje několik příkladů dat, která nejsou nezávislá, ale jejich kovariance jsou $ 0 $. Jedním z důležitých zvláštních případů je, že jsou-li dvě proměnné společně normálně distribuovány, pak jsou nezávislé, pokud a pouze tehdy, když nesouvisí . Dalším zvláštním případem je, že páry proměnných bernoulli nejsou vzájemně korelované právě tehdy, pokud jsou nezávislé (díky @ cardinal).
(3) Struktura variance / kovariance (často nazývaná jednoduše kovarianční struktura ) v návrzích opakovaných opatření odkazuje na strukturu použitou k modelování skutečnosti, že opakovaná měření na jednotlivcích jsou potenciálně korelována (a proto jsou závislá) – to se děje modelováním položek v kovarianční matici opakovaných měření. Jedním z příkladů je vyměnitelná korelační struktura s konstantní odchylkou , která určuje, že každé opakované měření má stejnou odchylku a všechny páry měření jsou korelovány stejně. Lepší volbou může být určit kovarianční strukturu, která vyžaduje, aby dvě měření byla od sebe vzdálena v čase, aby byla méně korelována (např. autoregresní model ). Všimněte si, že pojem kovarianční struktura vzniká obecněji v mnoha druzích vícerozměrných analýz , kde je možné korelovat pozorování.
Komentáře
- vaše vysvětlení je hezké. Následuje cenný doplněk, který vyvolal zajímavou sérii komentářů. Všem moc děkuji :)!
Odpověď
Odpověď makra je vynikající, ale chci přidat více k bodu, jak kovariance souvisí s korelací. Kovariance vám opravdu neřekne o síle vztahu mezi těmito dvěma proměnnými, zatímco korelace ano. Například:
x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here
Nyní dovolte „změnit měřítko a vynásobte x a y 10
x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200
Změna měřítka by neměla zvýšit sílu vztahu, takže se můžeme upravit vydělením kovariancí standardními odchylkami x a y, což je přesně definice korelačního koeficientu.
V obou výše uvedených případech je korelační koeficient mezi x a y 0.98198
.
Komentáře
- " Kovariance vám ' ve skutečnosti neříká o síle vztahu mezi těmito dvěma proměnnými, zatímco korelace ano." Toto tvrzení je zcela nepravdivé. Obě míry jsou shodné modulo škálování pomocí dvou směrodatných odchylek.
- @DavidHeffernan, ano, pokud je měřítko směrodatnými odchylkami, pak kovariance nám říká o síle vztahu. Avšak kovarianční měření samo o sobě nám to ' neříká.
- @DavidHeffernan, myslím, že to, co říká Akavall, je, že pokud ne ' neznáte měřítko proměnných , pak kovariance vám neříká nic o síle vztahu – lze interpretovat pouze znaménko.
- V jaké praktické situaci můžete získat kovarianci, aniž byste byli schopni získat dobrý odhad rozsahu proměnných?
- Není však vždy nutné znát směrodatnou odchylku, abyste pochopili měřítko a proměnná a tím i síla vztahu. Nestandardizované účinky jsou často informativní. Např. Pokud školení způsobí, že tam lidé v průměru zvýší příjem o 10 000 $ ročně, je to ' pravděpodobně lepší známkou síly účinku, než říkat, že existuje ar = .34 korelace mezi absolvováním kurzu a příjmem.