Robię regresję liniową z przekształconą zmienną zależną. Poniższa transformacja została wykonana tak, aby założyć normalność reszt będzie się utrzymywać. Nieprzetransformowana zmienna zależna była ujemnie wypaczona, a następująca transformacja sprawiła, że była bliska normalnej:
$$ Y = \ sqrt {50-Y_ {orig}} $$
gdzie $ Y_ {orig} $ jest zmienną zależną na oryginalnej skali.
Myślę, że sensowne jest użycie transformacji współczynników $ \ beta $, aby wrócić do pierwotnej skali. Korzystając z następującego równania regresji,
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
i ustalając $ X = 0 $, mamy
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
I na koniec ,
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
Korzystając z tej samej logiki, znalazłem
$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$
Teraz wszystko działa bardzo dobrze model z 1 lub 2 predyktorami; współczynniki po transformacji wstecznej przypominają oryginalne, tylko teraz mogę ufać standardowym błędom. Problem pojawia się, gdy dołączasz termin interakcji, taki jak
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$
Zatem transformacja wsteczna dla $ \ beta $ s nie jest tak bliska wartościom z oryginalnej skali i nie jestem pewien, dlaczego tak się dzieje. Nie jestem też pewien, czy wzór znaleziony dla odwrotnej skali przekształcenie współczynnika beta jest użyteczne, podobnie jak w przypadku trzeciego $ \ beta $ (dla terminu interakcji). Zanim przejdę do szalonej algebry, pomyślałem, że poproszę o radę …
Komentarze
- Jak definiujesz $ \ alpha_ {orig} $ i $ \ beta_ {orig} $?
- Jako wartość alfa i beta w oryginalnych skalach
- Ale co to oznacza?
- Dla mnie to wydaje się bezsensowne. Zgadzam się z odpowiedzią gung '.
Odpowiedź
Jednym problemem jest to, że napisałeś
$$ Y = α + β⋅X $$
To jest prosty deterministyczny (tj. nielosowy ) Model. W takim przypadku mógłbyś z powrotem przekształcić współczynniki w oryginalnej skali, ponieważ to tylko kwestia prostej algebry Ale w zwykłej regresji masz tylko $ E (Y | X) = α + β⋅X $; zostawiłeś składnik błędu poza modelem. Jeśli transformacja z $ Y $ z powrotem do $ Y_ {orig} $ jest nieliniowa, możesz mieć problem, ponieważ $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , ogólnie. Myślę, że może to mieć związek z rozbieżnością, którą „widzisz”.
Edytuj: Pamiętaj, że jeśli transformacja jest liniowa, możesz wykonać transformację wsteczną, aby uzyskać szacunki współczynników w oryginalnej skali, ponieważ oczekiwanie jest liniowe.
Komentarze
- + 1, aby wyjaśnić, dlaczego możemy ' z powrotem przekształcić wersje beta.
Odpowiedź
Doceniam twoje wysiłki, ale szczekasz na niewłaściwe drzewo. Nie możesz z powrotem przekształcić wersji beta. Twój model zachowuje się w świecie przekształconych danych. Jeśli chcesz na przykład przewidzieć, możesz z powrotem przekształcić $ \ hat {y} _i $, ale to wszystko. Oczywiście możesz również uzyskać przedział przewidywania, obliczając górne i dolne wartości graniczne, a następnie je również z powrotem przekształcić, ale w żadnym wypadku nie przekształcasz z powrotem wartości beta.
Komentarze
- Co sądzić o tym, że współczynniki po transformacji wstecznej są bardzo zbliżone do otrzymanych podczas modelowania zmiennej nietransformowanej? Czy nie ' nie pozwala na jakieś wnioskowanie w oryginalnej skali?
- Nie ' nie wiem dokładnie. Może zależeć od wielu rzeczy. Moje pierwsze przypuszczenie jest takie, że ' masz szczęście z pierwszą parą wersji beta, ale potem się kończy. Muszę zgodzić się w / @ mark999, że " szacunki, które otrzymaliśmy ' d, były oryginalnymi danymi dostosowanymi do regresji liniowej " nie ' właściwie nie ma sensu; Chciałbym, żeby tak się & na pierwszy rzut oka wydaje się rumienić, ale niestety nie ' t. I nie ' nie licencjonuje żadnych wniosków dotyczących oryginalnej skali.
- @gung dla transformacji nieliniowych (powiedzmy box cox): Mogę przekształcić dopasowane wartości jako jak również przedziały przewidywania, ale mogę ' t przekształcić bety ani przedziały współczynników dla wersji beta. Czy są jakieś dodatkowe ograniczenia, o których powinienem wiedzieć? przy okazji, jest to bardzo interesujący temat, gdzie mogę lepiej go zrozumieć?
- @mugen, to ' trudno powiedzieć, o czym jeszcze powinieneś wiedzieć z.Jedną z rzeczy, o których warto pamiętać, jest to, że odwrotna transformacja y-hat daje warunkową medianę , podczas gdy niezmieniony (bleck) y-hat jest średnią warunkową. Poza tym ten materiał powinien być omówiony w dobrym podręczniku regresji.
- @mugen, jesteś ' witamy ponownie. Możesz zadawać więcej pytań za pomocą zwykłych mechanizmów (klikając
ASK QUESTION
); będzie więcej zasobów do udzielania odpowiedzi, zwrócisz uwagę większej liczby CV, & informacje będą lepiej dostępne dla potomności.