Interpretace kladné a záporné váhy beta v regresní rovnici

Tuto základní otázku jsem obdržel e-mailem:

V regresní rovnici mám pravdu, když si myslím, že pokud je hodnota beta pozitivní, závislá proměnná se zvýšila v reakci na větší použití nezávislé proměnné a pokud je negativní, závislá proměnná se snížila v reakci na zvýšení nezávislá proměnná – podobná způsobu, jakým čtete korelace?

Komentáře

  • @Jeromy, váhami beta máte na mysli koeficienty lineární regrese?
  • @mp Konvenčně jsou beta koeficienty, když byly všechny proměnné standardizovány. (To by je mělo okamžitě učinit rozpoznatelnými jako částečné korelace, zodpovězení otázky … 🙂
  • @ayush Uvědomuji si, že jde o elementární otázku, takže na ni neodpovídejte sami. Myslím si však, že pro web může být prospěšné mít otázky na různých úrovních obtížnosti; a já ' bych rád přidal svou vlastní odpověď poté, co jsem dal ostatním šanci odpovědět, což navazuje na několik obecných problémů.
  • Dobrá poznámka, @Jeromy. Jsem si ' jistý, že by @ayush neposkytl takový komentář (který lze snadno nesprávně interpretovat jako hrubý nebo horší), pokud by stejnou otázku položil nový uživatel. Pojďme ' s vzít to jako svědectví o své vysoké reputaci zde a uvidíme, jestli některá z odpovědí pomůže osvětlit vašeho korespondenta.
  • @whuber. dobrý postřeh. Jako statistický konzultant v psychologii dostávám někdy e-mailem otázky, které jsou docela základní. Moje ideální situace je povzbudit takové studenty, aby zveřejňovali příspěvky přímo zde. Obecně dávám přednost odpovědi na tyto otázky na tomto webu, než abych studentovi zaslal e-mailovou odpověď. Tímto způsobem může být moje odpověď trvalým zdrojem pro internet a ostatní mohou přijít s ještě lepší odpovědí.

Odpovědět

Při vysvětlování významu regresního koeficientu jsem zjistil, že následující vysvětlení je velmi užitečné. Předpokládejme, že máme regresi

$$ Y = a + bX $$

Řekněte $ X $ změny o $ \ Delta X $ a $ Y $ změny o $ \ Delta Y $ . Protože máme lineární vztah, který máme,

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Protože $ Y = a + bX $ dostaneme

$$ \ Delta Y = b \ Delta X. $$

Je snadné vidět, že pokud je $ b $ pozitivní, pak pozitivní změna v $ X $ povede k pozitivní změna v $ Y $. Pokud je $ b $ záporné, pak pozitivní změna v $ X $ povede k negativní změně v $ Y $.

Poznámka: S touto otázkou jsem zacházel jako s pedagogickou, tj. poskytl jsem jednoduché vysvětlení.

Poznámka 2: Jak zdůraznil @whuber, toto vysvětlení má důležitý předpoklad, že vztah platí pro všechny možné hodnoty $ X $ a $ Y $. Ve skutečnosti se jedná o velmi omezující předpoklad, na druhou stranu je vysvětlení platné pro malé hodnoty $ \ Delta X $, protože Taylorova věta říká, že vztahy, které lze vyjádřit jako diferencovatelné funkce (a to je rozumný předpoklad, aby ) jsou lokálně lokální.

Komentáře

  • … za předpokladu, že chování je skutečně lineární v celém rozsahu hodnot $ X $! (Opatrnější odpověď by mohla pojmout stejnou myšlenku, pokud jde o průměrné změny, a také se vyhnout jakémukoli náznaku, že by vztah byl příčinný.)
  • @ whuber, věděl jsem, že uvedení slovo nejlepší nebyla moudrá volba 🙂 Díky za váš komentář, ' se pokusím odpověď přeformulovat.
  • @mp " Nejlepší " není ' nutně problém. Jen se ' snažím vám to zabrat 🙂 (Ale " vyvolá " dostal mou pozornost …) Pokud jste ' skutečně po " nejlepším " vysvětlení, připomeňme si, že mezi nezasvěcenými je běžný zmatek tím, jak interpretovat koeficienty interakce: koneckonců nemůžete ' t nezávisle měnit (řekněme) $ XY $; učiníte tak změnou buď $ X $ nebo $ Y $ nebo obou. Vysvětlení, které tuto situaci zvládne, by tedy bylo velmi vítané.
  • @ whuber, ano, indukovat byla špatná volba. Vysvětlení termínů interakce nechám ' na někoho jiného 🙂
  • @mp re Poznámka 2: Ah, Taylor ' s Věta! Skutečná data však nejsou ' ani spojitá, mnohem méně rozlišitelná. Tyto matematické vlastnosti by mohl model využívat. Obzvláště ve vysvětlení pro nezasvěcené může být užitečné odlišit chování modelu ' od chování, které od dat očekáváme.Také Taylor ' s věta říká málo o rozsahu hodnot $ X $, nad nimiž platí téměř linearita. Regresní model říká, že tento rozsah je nekonečný!

Odpověď

Jak poznamenává @gung, existují různé konvence týkající se význam ($ \ beta $, tj. „beta“). V širší statistické literatuře se beta často používá k představení nestandardizovaných koeficientů. V psychologii (a možná i v jiných oblastech) se však často rozlišuje mezi b pro nestandardizované a beta pro standardizované koeficienty. Tato odpověď předpokládá, že kontext naznačuje, že beta představuje standardizované koeficienty:

  • Beta váhy: Jak @whuber zmínil, „váhy beta“ jsou podle konvence standardizované regresní koeficienty (viz wikipedia o standardizovaném koeficientu ). V této souvislosti se $ b $ často používá pro nestandardizované koeficienty a $ \ beta $ se často používá pro standardizované koeficienty.

  • Základní interpretace : Váha beta pro danou proměnnou prediktoru je předpokládaný rozdíl ve výsledné proměnné ve standardních jednotkách pro zvýšení jedné standardní odchylky dané proměnné prediktoru, které drží všechny ostatní prediktory konstantní.

  • Obecný zdroj pro vícenásobnou regresi: Otázka je elementární a znamená, že byste si měli přečíst nějaký obecný materiál o vícenásobné regrese ( zde je základní popis Andy Field ).

  • Příčinnost: Dávejte pozor na jazyk typu „závislá proměnná se zvýšila v reakci na větší využití nezávislé proměnné“ . Takový jazyk má kauzální konotace. Váhy beta samy o sobě nestačí k ospravedlnění kauzální interpretace. K odůvodnění kauzální interpretace budete potřebovat další důkazy.

Komentáře

  • +1 Všimněte si však, že jsou odlišné konvence s ohledem na používání termínů ve statistikách. Například ' beta ' / $ \ beta $ se často používá k označení skutečného parametru, který řídí proces generování dat, & ' beta hat ' / $ \ hat \ beta $ odkazuje na odhad sklonu vypočítaný v váš vzorek. V tomto případě neznamenají, že proměnné byly standardizovány jako první. Toto různé použití je nešťastné, ale přesto skutečné. Je důležité mít jasno v tom, jak se termíny používají, když se s nimi někdo setká, spíše než za předpokladu, že každý má na mysli to samé.
  • @gung dobrý bod; ' Aktualizoval jsem svou odpověď, abych ji začlenil.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *