Interpretazione dei pesi beta positivi e negativi nellequazione di regressione

Ho ricevuto questa domanda elementare tramite email:

In unequazione di regressione ho ragione nel pensare che se il valore beta è positivo la variabile dipendente è aumentata in risposta a un maggiore uso della variabile indipendente, e se negativa la variabile dipendente è diminuita in risposta a un aumento di la variabile indipendente – simile al modo in cui leggi le correlazioni?

Commenti

  • @Jeromy, per pesi beta intendi i coefficienti di regressione lineare?
  • @mp Convenzionalmente, i beta sono i coefficienti quando tutte le variabili sono state standardizzate. (Questo dovrebbe renderli immediatamente riconoscibili come correlazioni parziali, rispondendo alla domanda … 🙂
  • @ayush Mi rendo conto che è una domanda elementare, quindi sentiti libero di non rispondere tu stesso. Tuttavia, penso che il sito possa trarre vantaggio dallavere domande a vari livelli di difficoltà; e io ' vorrei aggiungere la mia risposta dopo aver dato ad altri la possibilità di rispondere su alcune questioni generali.
  • Buona osservazione, @Jeromy. Sono ' sono sicuro che @ayush non avrebbe fornito un simile commento (che potrebbe facilmente essere interpretato erroneamente come scortese o peggio) se la stessa domanda fosse stata posta da un nuovo utente. Lascia che ' prenda questo come testimonianza della tua alta reputazione qui e vediamo se qualcuna delle risposte aiuta a illuminare il tuo corrispondente.
  • @whuber. buon punto. Essendo un consulente statistico in psicologia, a volte ricevo domande via e-mail che sono abbastanza elementari. La mia situazione ideale è incoraggiare questi studenti a postare direttamente qui. In generale, preferisco rispondere a queste domande su questo sito piuttosto che inviare una risposta via e-mail allo studente. In questo modo, la mia risposta può essere una risorsa continua per Internet e altri potrebbero trovare una risposta ancora migliore.

Risposta

Nello spiegare il significato del coefficiente di regressione ho trovato molto utile la seguente spiegazione. Supponiamo di avere la regressione

$$ Y = a + bX $$

Supponiamo che $ X $ cambi di $ \ Delta X $ e $ Y $ cambi di $ \ Delta Y $ . Poiché abbiamo la relazione lineare, abbiamo

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Poiché $ Y = a + bX $ otteniamo che

$$ \ Delta Y = b \ Delta X. $$

Avendo questo è facile vedere che se $ b $ è positivo, allora un cambiamento positivo in $ X $ si tradurrà in variazione positiva in $ Y $. Se $ b $ è negativo, una variazione positiva in $ X $ risulterà in una variazione negativa in $ Y $.

Nota: Ho trattato questa domanda come una domanda pedagogica, ovvero ho fornito una spiegazione semplice.

Nota 2: Come sottolineato da @whuber, questa spiegazione presuppone che la relazione valga per tutti i possibili valori di $ X $ e $ Y $. In realtà questa è unipotesi molto restrittiva, daltra parte la spiegazione è valida per piccoli valori di $ \ Delta X $, poiché il teorema di Taylor dice che le relazioni che possono essere espresse come funzioni differenziabili (e questa è unassunzione ragionevole da fare ) sono lineari localmente.

Commenti

  • … supponendo che il comportamento sia veramente lineare nellintero intervallo di $ X $ valori! (Una risposta più cauta potrebbe esprimere la stessa idea in termini di modifiche medie ed evitare anche qualsiasi accenno a suggerire che la relazione sia causale.)
  • @whuber, sapevo che mettendo il la parola migliore non è stata una scelta saggia 🙂 Grazie per il tuo commento, ' cercherò di riformulare la risposta.
  • @mp " Il " ' migliore non è necessariamente un problema. ' sto solo cercando di darti del filo da torcere 🙂 (ma " induce " ha attirato la mia attenzione …) Se ' sei veramente alla ricerca del " migliore ", ricorda che un punto comune di confusione tra i non iniziati è come interpretare i coefficienti di interazione: dopo tutto, puoi ' t variare (diciamo) $ XY $; lo fai variando $ X $ o $ Y $ o entrambi. Quindi una spiegazione che gestisca quella situazione sarebbe la benvenuta.
  • @whuber, yes induce era una scelta sbagliata. ' lascio la spiegazione dei termini di interazione per qualcun altro 🙂
  • @mp re Nota 2: Ah, Taylor ' s Teorema! Ma i dati reali non sono ' neppure continui, molto meno differenziabili. Il modello potrebbe godere di queste proprietà matematiche. Soprattutto nelle spiegazioni per chi non lo sapesse, può essere utile distinguere il comportamento del modello ' dal comportamento che ci aspettiamo dai dati.Inoltre, il teorema di Taylor ' dice poco sullintervallo di valori $ X $ su cui vale la quasi linearità. Il modello di regressione dice che questo intervallo è infinito!

Answer

Come nota @gung, esistono diverse convenzioni riguardo il significato di ($ \ beta $, cioè “beta”). Nella più ampia letteratura statistica, il beta è spesso usato per rappresentare coefficienti non standardizzati. Tuttavia, in psicologia (e forse in altre aree), cè spesso una distinzione tra b per coefficienti non standardizzati e beta per coefficienti standardizzati. Questa risposta presume che il contesto indichi che la beta rappresenta coefficienti standardizzati:

  • Pesi beta: Come menzionato da @whuber, i “pesi beta” sono coefficienti di regressione standardizzati per convenzione (vedere wikipedia sul coefficiente standardizzato ). In questo contesto, $ b $ viene spesso utilizzato per coefficienti non standardizzati e $ \ beta $ viene spesso utilizzato per coefficienti standardizzati.

  • Interpretazione di base : un peso beta per una determinata variabile predittore è la differenza prevista nella variabile risultato in unità standard per un aumento di una deviazione standard sulla variabile predittiva data che contiene tutti gli altri predittori costante.

  • Risorsa generale sulla regressione multipla: La domanda è elementare e implica che dovresti leggere del materiale generale sulla regressione multipla ( ecco una descrizione elementare di Andy Field ).

  • Causalità: Fai attenzione a un linguaggio come “la variabile dipendente è aumentata in risposta a un maggiore utilizzo della variabile indipendente” . Tale linguaggio ha connotazioni causali. I pesi beta da soli non sono sufficienti per giustificare uninterpretazione causale. Avresti bisogno di prove aggiuntive per giustificare uninterpretazione causale.

Commenti

  • +1 Nota, tuttavia, che sono convenzioni diverse rispetto alluso dei termini nelle statistiche. Ad esempio, ' beta ' / $ \ beta $ viene spesso utilizzato per indicare il vero parametro che regola il processo di generazione dei dati, & ' beta hat ' / $ \ hat \ beta $ si riferisce alla stima della pendenza calcolata in il tuo campione. In questo caso, non implicano che le variabili siano state standardizzate prima. Questo utilizzo variabile è sfortunato, ma nondimeno reale. È importante essere chiari su come vengono usati i termini quando li si incontra, piuttosto che presumere che tutti intendano la stessa cosa.
  • @gung good point; ' ho aggiornato la mia risposta per includerla.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *