Fortolkning af positive og negative beta-vægte i regressionsligning

Jeg modtog dette elementære spørgsmål via e-mail:

I en regressionsligning er jeg korrekt i at tro, at hvis beta-værdien er positiv, er den afhængige variabel steget som reaktion på større brug af den uafhængige variabel, og hvis negativ, er den afhængige variabel faldet som svar på en stigning den uafhængige variabel – svarende til den måde, du læser sammenhænge på?

Kommentarer

  • @Jeromy, med betavægte mener du de lineære regressionskoefficienter?
  • @mp Konventionelt er beta koefficienterne, når alle variabler er blevet standardiseret. (Det skulle straks gøre dem genkendelige som delvise sammenhænge, som besvarer spørgsmålet … 🙂
  • @ayush Jeg er klar over, at det er et elementært spørgsmål, så er du velkommen til ikke at svare på det selv. Jeg tror dog, at webstedet kan drage fordel af at have spørgsmål på forskellige sværhedsgrader; og jeg ' vil gerne tilføje mit eget svar efter at have givet andre en chance for at svare, der samler et par generelle problemer.
  • Godt punkt, @Jeromy. Jeg ' er sikker på at @ayush ikke ville have givet en sådan kommentar (som let kunne fortolkes som uhøflig eller værre) var det samme spørgsmål, som en ny bruger stillede. Lad ' s tage dette som vidnesbyrd om dit høje omdømme her og se om nogle af svarene hjælper med at oplyse din korrespondent.
  • @whuber. god pointe. Som statsrådgiver i psykologi får jeg nogle gange spørgsmål via e-mail, der er ret elementære. Min ideelle situation er at tilskynde sådanne studerende til at poste direkte her. Generelt foretrækker jeg at besvare disse spørgsmål på dette websted i stedet for at sende et e-mail-svar til den studerende. På den måde kan mit svar være en løbende ressource for internettet, og andre kan komme med et endnu bedre svar.

Svar

Når jeg forklarede betydningen af regressionskoefficient, fandt jeg, at den følgende forklaring var meget nyttig. Antag, at vi har regression

$$ Y = a + bX $$

Sig $ X $ ændringer med $ \ Delta X $ og $ Y $ ændringer med $ \ Delta Y $ . Da vi har det lineære forhold, har vi

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Da $ Y = a + bX $ får vi det

$$ \ Delta Y = b \ Delta X. $$

At have dette er let at se, at hvis $ b $ positiv, så vil en positiv ændring i $ X $ resultere i positiv ændring i $ Y $. Hvis $ b $ er negativ, vil positiv ændring i $ X $ resultere i negativ ændring i $ Y $.

Bemærk: Jeg behandlede dette spørgsmål som et pædagogisk spørgsmål, dvs. give en simpel forklaring.

Note 2: Som påpeget af @whuber har denne forklaring en vigtig antagelse om, at forholdet gælder for alle mulige værdier på $ X $ og $ Y $. I virkeligheden er dette en meget begrænsende antagelse, på den anden side er forklaringen gyldig for små værdier på $ \ Delta X $, da Taylor sætning siger, at relationer, der kan udtrykkes som differentierbare funktioner (og dette er en rimelig antagelse at gøre ) er lineære lokalt.

Kommentarer

  • … forudsat at opførslen virkelig er lineær i hele området af $ X $ værdier! (Et mere forsigtigt svar kan lægge den samme idé med hensyn til gennemsnit ændringer og også undgå enhver antydning om at antyde, at forholdet er årsagssammenhængende.)
  • @whuber, jeg vidste, at ord bedst var ikke et klogt valg 🙂 Tak for din kommentar, jeg ' Jeg prøver at omformulere svaret.
  • @mp " Bedste " er ikke ' t nødvendigvis et problem. Jeg ' Jeg prøver bare at give dig en hård tid 🙂 (Men " inducerer " fik min opmærksomhed …) Hvis du ' virkelig er efter " bedste " forklaring, husk at et fælles forvirringspunkt blandt de uindviede er, hvordan man skal fortolke interaktionskoefficienter: når alt kommer til alt kan du ' t uafhængigt variere (sige) $ XY $; du gør det ved at variere enten $ X $ eller $ Y $ eller begge dele. Så en forklaring, der håndterer denne situation, ville være meget velkommen.
  • @whuber, ja fremkald var et dårligt valg. Jeg ' lader forklaringen af interaktionsudtryk for en anden 🙂
  • @mp re Bemærk 2: Ah, Taylor ' s sætning! Men ægte data er ikke ' ikke engang kontinuerlige, meget mindre differentierbare. -modellen kan nyde disse matematiske egenskaber. Især i forklaringer på uinitierede kan det være værd at skelne model ' s adfærd fra den adfærd, vi forventer af dataene.Også Taylor ' s sætning siger lidt om rækkevidden af $ X $ -værdier, som næsten lineæritet gælder for. Regressionsmodellen siger, at dette interval er uendeligt!

Svar

Som @gung bemærker, er der forskellige konventioner angående betydningen af ($ \ beta $, dvs. “beta”). I den bredere statistiske litteratur bruges beta ofte til at repræsentere ikke-standardiserede koefficienter. Imidlertid er der i psykologi (og måske andre områder) ofte en skelnen mellem b for ikke-standardiseret og beta for standardiserede koefficienter. Dette svar antager, at konteksten indikerer, at beta repræsenterer standardiserede koefficienter:

  • Beta-vægte: Som @whuber nævnte, er “beta-vægte” ved konvention standardiserede regressionskoefficienter (se wikipedia om standardiseret koefficient ). I denne sammenhæng bruges $ b $ ofte til ikke-standardiserede koefficienter, og $ \ beta $ bruges ofte til standardiserede koefficienter.

  • Grundlæggende fortolkning : En beta-vægt for en given forudsigelsesvariabel er den forudsagte forskel i udfaldsvariablen i standardenheder for en standardafvigelsesforøgelse på den givne forudsigelsesvariabel, der holder alle andre forudsigere konstant.

  • Generel ressource ved multipel regression: Spørgsmålet er elementært og indebærer, at du skal læse noget generelt materiale om multipel regression ( her er en elementær beskrivelse af Andy Field ).

  • Årsag: Vær forsigtig med sprog som “den afhængige variabel er steget som svar på større brug af den uafhængige variabel” . Et sådant sprog har årsagssammenhæng. Betavægte i sig selv er ikke nok til at retfærdiggøre en kausal fortolkning. Du ville kræve yderligere beviser for at retfærdiggøre en kausal fortolkning.

Kommentarer

  • +1 Bemærk dog, at der er forskellige konventioner med hensyn til brugen af udtryk i statistikker. For eksempel bruges ' beta ' / $ \ beta $ ofte til at angive den sande parameter, der styrer datagenereringsprocessen, & ' beta hat ' / $ \ hat \ beta $ refererer til hældningsestimatet beregnet i din prøve. I dette tilfælde antyder de ikke, at variablerne er standardiseret 1.. Denne varierende anvendelse er uheldig, men ikke desto mindre reel. Det er vigtigt at være klar over, hvordan udtryk bruges, når man møder dem, snarere end at antage, at alle mener det samme.
  • @gung godt punkt; Jeg ' har opdateret mit svar for at indarbejde dette.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *