Tolkning av positive og negative beta-vekter i regresjonsligning

Jeg fikk dette elementære spørsmålet på e-post:

I en regresjonsligning er jeg korrekt når jeg tenker at hvis betaverdien er positiv, har den avhengige variabelen økt som svar på større bruk av den uavhengige variabelen, og hvis negativ, har den avhengige variabelen redusert som svar på en økning i den uavhengige variabelen – lik måten du leser sammenhenger på?

Kommentarer

  • @Jeromy, Med beta-vekter mener du de lineære regresjonskoeffisientene?
  • @mp Konvensjonelt er beta-koeffisientene når alle variablene er standardisert. (Det skal umiddelbart gjøre dem gjenkjennelige som delvise sammenhenger, og svare på spørsmålet … 🙂
  • @ayush Jeg skjønner at det er et elementært spørsmål, så vær så snill å ikke svare på det selv. Imidlertid tror jeg nettstedet kan ha nytte av å ha spørsmål på ulike vanskelighetsgrader; og jeg ' vil legge til mitt eget svar etter å ha gitt andre en sjanse til å svare som tar opp noen generelle problemer.
  • Bra poeng, @ Jeromy. Jeg ' er sikker på at @ayush ikke ville ha gitt en slik kommentar (som lett kunne tolkes som uhøflig eller verre) var det samme spørsmålet som ble stilt av en ny bruker. La ' s ta dette som et vitnesbyrd om ditt høye rykte her og se om noen av svarene hjelper med å opplyse korrespondenten.
  • @whuber. godt poeng. Å være statistikkonsulent i psykologi får jeg noen ganger spørsmål på e-post som er ganske grunnleggende. Min ideelle situasjon er å oppmuntre slike studenter til å poste direkte her. Generelt foretrekker jeg å svare på disse spørsmålene på dette nettstedet i stedet for å sende et svar på e-post til studenten. På den måten kan svaret mitt være en kontinuerlig ressurs for internett, og andre kan komme med et enda bedre svar.

Svar

Når jeg forklarte betydningen av regresjonskoeffisient, fant jeg at følgende forklaring var veldig nyttig. Anta at vi har regresjon

$$ Y = a + bX $$

Si $ X $ endringer med $ \ Delta X $ og $ Y $ endringer med $ \ Delta Y $ . Siden vi har det lineære forholdet har vi

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Siden $ Y = a + bX $ får vi det

$$ \ Delta Y = b \ Delta X. $$

Å ha dette er lett å se at hvis $ b $ positivt, vil positiv endring i $ X $ resultere i positiv endring i $ Y $. Hvis $ b $ er negativ, vil positiv endring i $ X $ føre til negativ endring i $ Y $.

Merk: Jeg behandlet dette spørsmålet som et pedagogisk spørsmål, dvs. gi enkel forklaring.

Merk 2: Som påpekt av @whuber, har denne forklaringen en viktig antagelse om at forholdet gjelder for alle mulige verdier på $ X $ og $ Y $. I virkeligheten er dette en veldig begrensende antagelse, på den annen side er forklaringen gyldig for små verdier på $ \ Delta X $, siden Taylor-teorem sier at relasjoner som kan uttrykkes som differensierbare funksjoner (og dette er en rimelig antagelse å gjøre ) er lineære lokalt.

Kommentarer

  • … forutsatt at oppførselen virkelig er lineær over hele spekteret av $ X $ -verdier! (Et mer forsiktig svar kan legge den samme ideen når det gjelder gjennomsnittlige endringer og også unngå antydninger om å antyde at forholdet er årsakssammenheng.)
  • @whuber, jeg visste at å sette ord best var ikke et klokt valg 🙂 Takk for kommentaren din, jeg ' Jeg prøver å omformulere svaret.
  • @mp " Beste " er ikke ' t nødvendigvis et problem. Jeg ' prøver bare å gi deg vanskelig tid 🙂 (Men " induserer " fikk oppmerksomhet …) Hvis du ' virkelig er ute etter " best " forklaring, husk at et vanlig forvirringspunkt blant uinnvidde er hvordan man skal tolke interaksjonskoeffisienter: når alt kommer til alt kan du ' t uavhengig variere (si) $ XY $; du gjør det ved å variere enten $ X $ eller $ Y $ eller begge deler. Så en forklaring som håndterer den situasjonen, vil være hjertelig velkommen.
  • @whuber, ja indusere var et dårlig valg. Jeg ' La igjen forklaringen på interaksjonsbetingelser for noen andre 🙂
  • @mp re Merknad 2: Ah, Taylor ' s teorem! Men ekte data er ikke ' ikke engang kontinuerlig, mye mindre differensierbar. -modellen kan ha glede av disse matematiske egenskapene. Spesielt i forklaringer på uinnvidde kan det lønne seg å skille modellens ' oppførsel fra oppførselen vi forventer av dataene.Også Taylor ' s teorem sier lite om rekkevidden av $ X $ -verdier som nesten-linearitet gjelder. Regresjonsmodellen sier at dette området er uendelig!

Svar

Som @gung bemerker, er det varierende konvensjoner angående betydningen av ($ \ beta $, dvs. «beta»). I den bredere statistiske litteraturen brukes beta ofte til å representere ikke-standardiserte koeffisienter. Imidlertid er det i psykologi (og kanskje andre områder) ofte et skille mellom b for ikke-standardiserte og beta for standardiserte koeffisienter. Dette svaret forutsetter at konteksten indikerer at beta representerer standardiserte koeffisienter:

  • Beta-vekter: Som @whuber nevnte, er «beta-vekter» etter konvensjon standardiserte regresjonskoeffisienter (se wikipedia om standardisert koeffisient ). I denne sammenhengen brukes ofte $ b $ til ikke-standardiserte koeffisienter, og $ \ beta $ brukes ofte til standardiserte koeffisienter.

  • Grunnleggende tolkning : En betavekt for en gitt prediktorvariabel er den forutsagte forskjellen i utfallsvariabelen i standardenheter for en standardavviksøkning på den gitte prediktorvariabelen som inneholder alle andre prediktorer konstant.

  • Generell ressurs på multippel regresjon: Spørsmålet er elementært og innebærer at du bør lese noe generelt materiale om multippel regresjon ( her er en elementær beskrivelse av Andy Field ).

  • Årsak: Vær forsiktig med språk som «den avhengige variabelen har økt som svar på større bruk av den uavhengige variabelen» . Slike språk har kausale konnotasjoner. Beta-vekter i seg selv er ikke nok til å rettferdiggjøre en årsaksfortolkning. Du vil trenge ytterligere bevis for å rettferdiggjøre en årsakssammenheng.

Kommentarer

  • +1 Vær imidlertid oppmerksom på at det er forskjellige konvensjoner med hensyn til begrepsbruk i statistikk. For eksempel blir ' beta ' / $ \ beta $ ofte brukt til å betegne den sanne parameteren som styrer datagenereringsprosessen, & ' beta hat ' / $ \ hat \ beta $ refererer til hellingsestimatet beregnet i prøven din. I dette tilfellet antyder de ikke at variablene er standardisert 1.. Denne varierende bruken er uheldig, men likevel ekte. Det er viktig å være tydelig på hvordan begreper blir brukt når man møter dem, i stedet for å anta at alle mener det samme.
  • @gung godt poeng; Jeg ' har oppdatert svaret mitt for å innlemme dette.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *