Zpětná transformace regresních koeficientů

Provádím lineární regresi s transformovanou závislou proměnnou. Následující transformace byla provedena tak, aby byl předpoklad normality reziduí bude držet. Netransformovaná závislá proměnná byla negativně vychýlena a následující transformace ji přiblížila normálu:

$$ Y = \ sqrt {50-Y_ {orig}} $$

kde $ Y_ {orig} $ je závislá proměnná v původním měřítku.

Myslím, že má smysl použít nějakou transformaci na koeficientech $ \ beta $, abychom se vrátili k původnímu měřítku. Pomocí následující regresní rovnice

$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$

a opravou $ X = 0 $, máme

$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$

A konečně ,

$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$

Pomocí stejné logiky jsem našel

$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$

Nyní věci fungují velmi dobře model s 1 nebo 2 prediktory; zpětně transformované koeficienty se podobají původním, až teď můžu věřit standardním chybám. Problém nastává při zahrnutí termínu interakce, například

$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$

Pak zpětná transformace pro $ \ beta $ s není tak blízká transformaci z původního měřítka a já si nejsem jistý, proč se to stane. Také si nejsem jistý, jestli vzorec nalezený pro back- transformace koeficientu beta je použitelná stejně jako pro 3. $ \ beta $ (pro termín interakce). Než jsem se pustil do šílené algebry, myslel jsem si, že „požádám o radu …

Komentáře

  • Jak definujete $ \ alpha_ {orig} $ a $ \ beta_ {orig} $?
  • Jako hodnota alfa a beta na původních stupnicích
  • Ale co to znamená?
  • Pro mě to vypadá jako nesmyslný koncept. Souhlasím s odpovědí gung '.

Odpověď

Jedním problémem je, že jste napsali

$$ Y = α + β⋅X $$

To je jednoduchá deterministická (tj. nenáhodná) ) Modelka. V takovém případě byste mohli zpět transformovat koeficienty v původním měřítku, protože jde pouze o nějakou jednoduchou algebru Ale v obvyklé regresi máte pouze $ E (Y | X) = α + β⋅X $; chybný termín jste ve svém modelu vynechali. Pokud je transformace z $ Y $ zpět na $ Y_ {orig} $ nelineární, můžete mít problém, protože $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , obecně. Myslím, že to může souviset s nesrovnalostí, kterou nyní vidíte.

Upravit: Pamatujte, že pokud je transformace lineární, můžete zpět transformaci získat odhady koeficientů v původním měřítku, protože očekávání je lineární.

Komentáře

  • + 1 pro vysvětlení proč nemůžeme ' vrátit transformaci betas.

odpověď

Zdravím zde vaše úsilí, ale štěkáte špatný strom. Nevrátíte zpět transformaci betas. Váš model drží ve světě transformovaných dat. Chcete-li například vytvořit předpověď, vrátíte zpět transformaci $ \ hat {y} _i $, ale to je vše. Samozřejmě můžete také získat interval predikce výpočtem horních a dolních mezních hodnot a pak je také zpětně transformovat, ale v žádném případě zpětně netransformujete beta verze.

Komentáře

  • Co udělat, když se zpětně transformované koeficienty velmi přiblíží koeficientům získaným při modelování netransformované proměnné? Neví ' to, že by to umožňovalo nějaký závěr v původním měřítku?
  • Nevím přesně to. Mohlo by to záviset na mnoha věcech. Můj první odhad je, že ' máte štěstí s vašimi prvními beta verzemi, ale pak se vaše štěstí vyčerpá. Musím souhlasit w / @ mark999, že " odhady, které ' d dostaneme, byly původní data vhodná pro lineární regrese " nemá ' ve skutečnosti žádný smysl; Přál bych si, aby se to & na první pohled zdálo červené, ale bohužel to ' t. A nedělá ' t licenci na žádné závěry v původním měřítku.
  • @gung pro nelineární transformace (řekněme box cox): Mohu zpět transformovat přizpůsobené hodnoty jako stejně jako intervaly predikce, ale nemohu ' t transformovat betas ani intervaly koeficientů pro betas. Existuje nějaké další omezení, o kterém bych měl vědět? btw, toto je velmi zajímavé téma, kde mohu lépe porozumět?
  • @mugen, ' je těžké říci, co dalšího byste si měli být vědomi z.Možná je třeba mít na paměti, že zpětná transformace y-hat vám dává podmíněný medián , zatímco zpětně transformovaný (bleck) y-hat je podmíněný průměr. Kromě toho by měl být tento materiál obsažen v učebnici dobré regrese.
  • @mugen, jste ' vítáni. Neváhejte se zeptat na více otázek pomocí běžných mechanismů (kliknutím ASK QUESTION); k dispozici bude více zdrojů pro zodpovězení, dostanete pozornost více CVers, & informace budou pro potomky lépe dostupné.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *