Co to jest kowariancja w prostym języku?

Co to jest kowariancja w prostym języku i jaki jest jej związek z terminami zależność , korelacja i Struktura wariancji-kowariancji w odniesieniu do projektów z powtarzanymi pomiarami?

Komentarze

Odpowiedź

Kowariancja to miara tego, jak zmiany jednej zmiennej są powiązane ze zmianami w ciągu sekundy zmienna. Konkretnie, kowariancja mierzy stopień, w jakim dwie zmienne są liniowo powiązane. Jednak jest również często używany nieformalnie jako ogólna miara tego, jak monotonicznie powiązane są dwie zmienne. Istnieje wiele przydatnych, intuicyjnych objaśnień kowariancji tutaj .

Jeśli chodzi o związek kowariancji z każdym z wymienionych terminów:

(1) Korelacja to przeskalowana wersja kowariancja przyjmująca wartości w $ [- 1,1] $ z korelacją $ \ pm 1 $ wskazującą na idealne powiązanie liniowe i 0 $ wskazującą na brak związku liniowego. To skalowanie sprawia, że korelacja jest niezmienna od zmian skali oryginalnych zmiennych (na co wskazuje Akavall i podaje przykład +1). Stała skalowania jest iloczynem odchyleń standardowych dwóch zmiennych.

(2) Jeśli dwie zmienne to niezależne , ich kowariancja wynosi 0 $. Jednak posiadanie kowariancji równej 0 $ nie oznacza, że zmienne są niezależne. Ta liczba (z Wikipedii)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ tutaj wprowadź opis obrazu

przedstawia kilka przykładowych wykresów danych, które nie są niezależne, ale ich kowariancje wynoszą 0 $. Jednym z ważnych przypadków specjalnych jest to, że jeśli dwie zmienne mają łącznie rozkład normalny, wtedy są niezależne wtedy i tylko wtedy, gdy są nieskorelowane . Innym szczególnym przypadkiem jest to, że pary zmiennych Bernoulliego są nieskorelowane wtedy i tylko wtedy, gdy są niezależne (dzięki @cardinal).

(3) struktura wariancji / kowariancji (często nazywana po prostu struktura kowariancji ) w projektach z powtarzanymi pomiarami odnosi się do struktury używanej do modelowania faktu, że powtarzane pomiary na osobnikach są potencjalnie skorelowane (i dlatego są zależne) – odbywa się to poprzez modelowanie wpisów w macierzy kowariancji powtarzanych pomiarów. Jednym z przykładów jest wymienna struktura korelacji ze stałą wariancją , która określa, że każdy powtórzony pomiar ma taką samą wariancję, a wszystkie pary pomiarów są jednakowo skorelowane. Lepszym wyborem może być określenie struktury kowariancji, która wymaga dwóch pomiarów wykonanych dalej od siebie, aby były mniej skorelowane (np. model autoregresyjny ). Zwróć uwagę, że termin struktura kowariancji pojawia się bardziej ogólnie w wielu rodzajach analiz wielowymiarowych , w których obserwacje mogą być skorelowane.

Komentarze

  • Twoje wyjaśnienie jest miłe. Towarzyszy mu cenny dodatek, który wywołał ciekawą serię komentarzy. Wielkie dzięki dla wszystkich :)!

Odpowiedź

Makro ”Odpowiedź jest doskonała, ale chcę dodaj więcej do tego, jak kowariancja jest powiązana z korelacją. Kowariancja tak naprawdę nie mówi ci o sile związku między dwiema zmiennymi, podczas gdy korelacja tak. Na przykład:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

Teraz zmieńmy skalę i pomnóżmy x i y przez 10

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

Zmiana skali nie powinna zwiększać siły związku, więc możemy dostosować, dzieląc kowariancje przez odchylenia standardowe x i y, co jest dokładnie definicją współczynnika korelacji.

W obu powyższych przypadkach współczynnik korelacji między x i y wynosi 0.98198.

Komentarze

  • " Kowariancja nie ' tak naprawdę nie mówi o sile związku między dwiema zmiennymi, podczas gdy korelacja już tak." To stwierdzenie jest całkowicie fałszywe. Te dwie miary to identyczne skalowanie modulo przez dwa odchylenia standardowe.
  • @DavidHeffernan, tak, jeśli przeskalowane przez odchylenia standardowe, wówczas kowariancja mówi nam o sile związku. Jednak sama miara kowariancji nie ' nam tego nie mówi.
  • @DavidHeffernan, myślę, że Akavall mówi, że jeśli nie ' nie znasz skali zmiennych , wtedy kowariancja nie mówi nic o sile związku – tylko znak może być zinterpretowany.
  • W jakiej praktycznej sytuacji można uzyskać kowariancję, nie będąc jednocześnie w stanie uzyskać dobrego oszacowania skali zmiennych?
  • Jednak nie zawsze jest konieczna znajomość odchylenia standardowego, aby zrozumieć skalę a zmienna, a tym samym siła związku. Niestandardowe efekty często mają charakter informacyjny. Np. Jeśli uczestnictwo w kursie szkoleniowym powoduje, że ludzie zwiększają tam dochód średnio o 10 000 USD rocznie, to ' jest prawdopodobnie lepszym wskaźnikiem siły efektu niż stwierdzenie, że wystąpiło ar = .34 korelacja między uczestnictwem w kursie a dochodami.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *