Interpretatie van positieve en negatieve bèta-gewichten in regressievergelijking

Ik ontving deze elementaire vraag per e-mail:

Heb ik in een regressievergelijking gelijk als ik denk dat als de bètawaarde positief is, de afhankelijke variabele is toegenomen als reactie op meer gebruik van de onafhankelijke variabele, en als deze negatief is, is de afhankelijke variabele afgenomen als reactie op een toename in de onafhankelijke variabele – vergelijkbaar met de manier waarop u correlaties leest?

Reacties

  • @Jeromy, met bèta-gewichten bedoelt u de lineaire regressiecoëfficiënten?
  • @mp Conventioneel zijn bètas de coëfficiënten wanneer alle variabelen gestandaardiseerd zijn. (Dat zou ze onmiddellijk herkenbaar moeten maken als gedeeltelijke correlaties, de vraag beantwoorden … 🙂
  • @ayush Ik realiseer me dat het een elementaire vraag is, dus voel je vrij om deze zelf niet te beantwoorden. Ik denk echter dat de site kan profiteren van vragen op verschillende moeilijkheidsgraden; en ik ' zou graag mijn eigen antwoord willen toevoegen nadat ik anderen een kans heb gegeven om te antwoorden dat een paar algemene kwesties oppikt.
  • Goed punt, @ Jeromy. Ik ' ben er zeker van dat @ayush niet zon opmerking zou hebben gemaakt (die gemakkelijk verkeerd geïnterpreteerd zou kunnen worden als onbeleefd of erger) als dezelfde vraag zou worden gesteld door een nieuwe gebruiker. Laat ' s dit beschouwen als een getuigenis van uw hoge reputatie hier en kijk of een van de antwoorden uw correspondent helpt.
  • @whuber. goed punt. Als statsconsultant in de psychologie krijg ik soms vragen per e-mail die redelijk elementair zijn. Mijn ideale situatie is om dergelijke studenten aan te moedigen rechtstreeks hier te posten. Over het algemeen beantwoord ik deze vragen liever op deze site dan een e-mail naar de student te sturen. Op die manier kan mijn reactie een doorlopende bron voor internet zijn en kunnen anderen met een nog beter antwoord komen.

Antwoord

Bij het uitleggen van de betekenis van regressiecoëfficiënt vond ik de volgende uitleg erg nuttig. Stel dat we de regressie hebben

$$ Y = a + bX $$

Zeg $ X $ wijzigingen met $ \ Delta X $ en $ Y $ wijzigingen met $ \ Delta Y $ . Omdat we de lineaire relatie hebben, hebben we

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Sinds $ Y = a + bX $ krijgen we dat

$$ \ Delta Y = b \ Delta X. $$

Dit is gemakkelijk in te zien dat als $ b $ positief, positieve verandering in $ X $ zal resulteren in positieve verandering in $ Y $. Als $ b $ negatief is, zal een positieve verandering in $ X $ resulteren in een negatieve verandering in $ Y $.

Opmerking: Ik behandelde deze vraag als een pedagogische vraag, dwz geef een eenvoudige uitleg.

Opmerking 2: Zoals aangegeven door @whuber heeft deze uitleg een belangrijke aanname dat de relatie geldt voor alle mogelijke waarden van $ X $ en $ Y $. In werkelijkheid is dit een zeer beperkende aanname, aan de andere kant is de verklaring geldig voor kleine waarden van $ \ Delta X $, aangezien de Taylor-stelling zegt dat relaties die kunnen worden uitgedrukt als differentieerbare functies (en dit is een redelijke veronderstelling om ) zijn lokaal lineair.

Opmerkingen

  • … aangenomen dat het gedrag echt lineair is over het hele bereik van $ X $ waarden! (Een voorzichtiger antwoord zou hetzelfde idee kunnen verwoorden in termen van gemiddelde veranderingen en ook elke suggestie vermijden dat de relatie causaal is.)
  • @whuber, ik wist dat het plaatsen van de woord beste was geen verstandige keuze 🙂 Bedankt voor je reactie, ik ' zal proberen het antwoord anders te formuleren.
  • @mp " Het beste " is niet ' niet per se een probleem. Ik ' m probeer het je gewoon moeilijk te maken 🙂 (Maar " induceer " heeft mijn aandacht getrokken …) Als je ' echt achter de " beste " uitleg, onthoud dat een algemeen punt van verwarring onder niet-ingewijden is hoe interactiecoëfficiënten moeten worden geïnterpreteerd: je kunt tenslotte ' onafhankelijk variëren (laten we zeggen) $ XY $; u doet dit door $ X $ of $ Y $ of beide te variëren. Dus een uitleg die die situatie aanpakt, zou zeer welkom zijn.
  • @whuber, ja induce was een slechte keuze. Ik ' laat de uitleg van interactietermen over aan iemand anders 🙂
  • @mp re Opmerking 2: Ah, Taylor ' s Stelling! Maar echte gegevens zijn ' zelfs niet continu, veel minder differentieerbaar. Het model kan genieten van deze wiskundige eigenschappen. Vooral in verklaringen voor niet-ingewijden, kan het de moeite waard zijn om het gedrag van het model ' te onderscheiden van het gedrag dat we van de gegevens verwachten.De stelling van Taylor ' zegt ook weinig over het bereik van $ X $ waarden waarover bijna-lineariteit geldt. Het regressiemodel zegt dat dit bereik oneindig is!

Antwoord

Zoals @gung opmerkt, zijn er verschillende conventies met betrekking tot de betekenis van ($ \ beta $, dwz “beta”). In de bredere statistische literatuur wordt bèta vaak gebruikt om niet-gestandaardiseerde coëfficiënten weer te geven. In de psychologie (en misschien ook op andere gebieden) is er vaak een onderscheid tussen b voor niet-gestandaardiseerde en bèta voor gestandaardiseerde coëfficiënten. Dit antwoord gaat ervan uit dat de context aangeeft dat bèta gestandaardiseerde coëfficiënten vertegenwoordigt:

  • Beta-gewichten: Zoals @whuber al zei, zijn “bèta-gewichten” volgens afspraak gestandaardiseerde regressiecoëfficiënten (zie wikipedia over gestandaardiseerde coëfficiënten ). In deze context wordt $ b $ vaak gebruikt voor niet-gestandaardiseerde coëfficiënten en $ \ beta $ wordt vaak gebruikt voor gestandaardiseerde coëfficiënten.

  • Basisinterpretatie : een bètagewicht voor een bepaalde voorspellende variabele is het voorspelde verschil in de uitkomstvariabele in standaardeenheden voor een toename van één standaarddeviatie op de gegeven voorspellende variabele met alle andere voorspellers constante.

  • Algemene bron over meervoudige regressie: De vraag is elementair en houdt in dat je wat algemeen materiaal over meervoudige regressie moet lezen ( hier is een elementaire beschrijving door Andy Field ).

  • Causaliteit: Wees voorzichtig met taal als “de afhankelijke variabele is toegenomen als reactie op een groter gebruik van de onafhankelijke variabele” . Dergelijke taal heeft causale connotaties. Beta-gewichten op zichzelf zijn niet voldoende om een causale interpretatie te rechtvaardigen. Je zou aanvullend bewijs nodig hebben om een causale interpretatie te rechtvaardigen.

Opmerkingen

  • +1 Merk echter op dat er zijn verschillende conventies met betrekking tot het gebruik van termen in statistieken. ' beta ' / $ \ beta $ wordt bijvoorbeeld vaak gebruikt om de ware parameter aan te duiden die het gegevensgeneratieproces bepaalt, & ' beta hat ' / $ \ hat \ beta $ verwijst naar de schatting van de helling berekend in uw monster. In dit geval impliceren ze niet dat de variabelen als eerste gestandaardiseerd zijn. Dit wisselende gebruik is jammer, maar niettemin reëel. Het is belangrijk om duidelijk te zijn over hoe termen worden gebruikt wanneer iemand ze tegenkomt, in plaats van aan te nemen dat iedereen hetzelfde bedoelt.
  • @gung goed punt; Ik ' heb mijn antwoord bijgewerkt om dit op te nemen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *