Cosè la covarianza in un linguaggio semplice?

Che cosè la covarianza in un linguaggio semplice e come è collegata ai termini dipendenza , correlazione e struttura varianza-covarianza rispetto a progetti a misure ripetute?

Commenti

Risposta

La covarianza è una misura di come i cambiamenti in una variabile sono associati ai cambiamenti in un secondo variabile. In particolare, la covarianza misura il grado di associazione lineare di due variabili. Tuttavia, viene spesso utilizzato anche in modo informale come misura generale di quanto siano monotonicamente correlate due variabili. Ci sono molte utili spiegazioni intuitive della covarianza qui .

Per quanto riguarda il modo in cui la covarianza è correlata a ciascuno dei termini che hai menzionato:

(1) Correlazione è una versione in scala di covarianza che assume valori in $ [- 1,1] $ con una correlazione di $ \ pm 1 $ che indica unassociazione lineare perfetta e $ 0 $ che indica nessuna relazione lineare. Questo ridimensionamento rende la correlazione invariante ai cambiamenti di scala delle variabili originali, (che Akavall sottolinea e fornisce un esempio di +1). La costante di scala è il prodotto delle deviazioni standard delle due variabili.

(2) Se due variabili sono indipendenti , la loro covarianza è $ 0 $. Tuttavia, avere una covarianza di $ 0 $ non implica che le variabili siano indipendenti. Questa cifra (da Wikipedia)

$ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $ inserisci qui la descrizione dellimmagine

mostra diversi grafici di esempio di dati che non sono indipendenti, ma le loro covarianze sono $ 0 $. Un caso speciale importante è che se due variabili sono congiuntamente normalmente distribuite, allora sono indipendenti se e solo se non sono correlati . Un altro caso speciale è che le coppie di variabili di bernoulli non sono correlate se e solo se sono indipendenti (grazie @cardinal).

(3) La struttura di varianza / covarianza (spesso chiamata semplicemente struttura di covarianza ) nei progetti a misure ripetute si fa riferimento alla struttura utilizzata per modellare il fatto che le misurazioni ripetute sugli individui sono potenzialmente correlate (e quindi sono dipendenti) – questo è fatto modellando le voci nella matrice di covarianza delle misurazioni ripetute. Un esempio è la struttura di correlazione intercambiabile con varianza costante che specifica che ogni misurazione ripetuta ha la stessa varianza e tutte le coppie di misurazioni sono ugualmente correlate. Una scelta migliore potrebbe essere quella di specificare una struttura di covarianza che richiede due misurazioni prese più distanti nel tempo per essere meno correlate (ad es. un modello autoregressivo ). Si noti che il termine struttura di covarianza si presenta più in generale in molti tipi di analisi multivariata in cui le osservazioni possono essere correlate.

Commenti

  • la tua spiegazione è carina. È seguito da un prezioso supplemento che ha causato uninteressante serie di commenti. Grazie mille a tutti :)!

Answer

La risposta della macro è eccellente, ma voglio aggiungere di più a un punto su come la covarianza è correlata alla correlazione. La covarianza non ti dice veramente della forza della relazione tra le due variabili, mentre la correlazione sì. Ad esempio:

x = [1, 2, 3] y = [4, 6, 10] cov(x,y) = 2 #I am using population covariance here 

Ora cambiamo la scala e moltiplichiamo sia x che y per 10

x = [10, 20, 30] y = [40, 60, 100] cov(x, y) = 200 

La modifica della scala non dovrebbe aumentare la forza della relazione, quindi possiamo aggiustare dividendo le covarianze per le deviazioni standard di x e y, che è esattamente la definizione del coefficiente di correlazione.

In entrambi i casi precedenti, il coefficiente di correlazione tra xey è 0.98198.

Commenti

  • " La covarianza ' non ti dice veramente della forza della relazione tra le due variabili, mentre la correlazione sì." Questa affermazione è completamente falsa. Le due misure sono identiche alla scala del modulo in base alle due deviazioni standard.
  • @DavidHeffernan, sì, se ridimensionata in base alle deviazioni standard, la covarianza ci dice la forza della relazione. Tuttavia, la misura della covarianza da sola non ' ce lo dice.
  • @DavidHeffernan, penso che ciò che Akavall sta dicendo sia che se non ' Per conoscere la scala delle variabili la covarianza non ti dice nulla sulla forza della relazione: solo il segno può essere interpretato.
  • In quale situazione pratica si può ottenere una covarianza senza poter anche ottenere una buona stima della scala delle variabili?
  • Tuttavia, non è sempre necessario conoscere la deviazione standard per comprendere la scala di una variabile e quindi la forza di una relazione. Gli effetti non standardizzati sono spesso informativi. Ad esempio, se un corso di formazione fa sì che le persone aumentino in media il loro reddito di $ 10.000 allanno, ' è probabilmente unindicazione migliore della forza delleffetto, piuttosto che dire che cera ar = .34 correlazione tra il corso e il reddito.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *