Eu „fac o regresie liniară cu o variabilă dependentă transformată. Următoarea transformare a fost făcută astfel încât asumarea normalității reziduurilor Variabila dependentă netransformată a fost înclinată negativ și următoarea transformare a făcut-o aproape de normal:
$$ Y = \ sqrt {50-Y_ {orig}} $$
unde $ Y_ {orig} $ este variabila dependentă de scara originală.
Cred că are sens să folosim o oarecare transformare a coeficienților $ \ beta $ pentru a ne întoarce la scara originală. Folosind următoarea ecuație de regresie,
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
și fixând $ X = 0 $, avem
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
Și în sfârșit ,
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
Folosind aceeași logică, am găsit
$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$
Acum lucrurile funcționează foarte bine pentru un model cu 1 sau 2 predictori; coeficienții transformați înapoi seamănă cu cei originali, abia acum pot avea încredere în erorile standard. Problema apare atunci când se include un termen de interacțiune, cum ar fi
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$
Atunci transformarea înapoi pentru $ \ beta $ s nu este atât de apropiată de cele din scara originală și „nu sunt sigur de ce se întâmplă acest lucru. De asemenea, nu sunt sigur dacă formula găsită pentru back- transformarea unui coeficient beta este utilizabilă ca și pentru al treilea $ \ beta $ (pentru termenul de interacțiune). Înainte de a intra în algebră nebună, m-am gândit să „cer sfaturi …
Comentarii
- Cum definiți $ \ alpha_ {orig} $ și $ \ beta_ {orig} $?
- Ca valoare alfa și beta pe scările originale
- Dar ce înseamnă asta?
- Pentru mine acesta pare un concept fără sens. Sunt de acord cu răspunsul gung '.
Răspuns
O problemă este că ați scris
$$ Y = α + β⋅X $$
Acesta este un determinist simplu (adică non-aleatoriu ) model. În acest caz, ați putea transforma înapoi coeficienții pe scara originală, deoarece este doar o chestiune de o algebră simplă Dar, în regresia obișnuită, aveți doar $ E (Y | X) = α + β⋅X $; ați lăsat termenul de eroare în afara modelului dvs. Dacă transformarea din $ Y $ înapoi în $ Y_ {orig} $ este neliniară, este posibil să aveți o problemă din moment ce $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , în general. Cred că acest lucru poate avea legătură cu discrepanța pe care o vedeți.
Editați: Rețineți că dacă transformarea este liniară, puteți transforma înapoi pentru a obține estimări ale coeficienților pe scara originală, deoarece așteptarea este liniară.
Comentarii
- + 1 pentru a explica de ce putem ' să transformăm înapoi beta-urile.
Răspuns
Vă salut eforturile aici, dar sunteți lătrat în copacul greșit. Nu transformați înapoi versiunile. Modelul dvs. se menține în lumea datelor transformate. Dacă doriți să faceți o predicție, de exemplu, transformați înapoi $ \ hat {y} _i $, dar asta este. Desigur, puteți obține, de asemenea, un interval de predicție calculând valorile limită superioară și inferioară și apoi transformați-le și înapoi, dar în niciun caz nu transformați înapoi beta-urile.
Comentarii
- Ce să facem din faptul că coeficienții transformați înapoi se apropie foarte mult de cei obținuți la modelarea variabilei netransformate? ' nu permite anumite inferențe la scara inițială?
- Nu știu exact, ' Ar putea depinde orice număr de lucruri. Prima mea presupunere este că ' ai noroc cu primul tău cuplu de beta, dar apoi norocul tău se termină. Trebuie să fiu de acord cu @ mark999 că " estimările pe care le obținem ' erau datele originale potrivite pentru regresia liniară " nu are ' de fapt nici un sens; Mi-aș dori ca & pare să se înroșească la început, dar din păcate nu ' t. Și nu ' nu licențiază nicio inferență pe scara originală.
- @gung pentru transformări neliniare (să zicem box cox): pot transforma înapoi valorile ajustate ca precum și intervale de predicție, dar nu pot ' t transforma beta și nici intervale de coeficient pentru beta. Există vreo limită suplimentară de care ar trebui să știu? btw, acesta este un subiect foarte interesant, unde pot obține o mai bună înțelegere?
- @mugen, este ' greu de spus ce altceva ar trebui să fii conștient de.Un lucru pe care poate trebuie să-l țineți cont este că transformarea înapoi a y-hat vă oferă mediană condițională, în timp ce y-hat un-back-transformat (bleck) este media condițională. În afară de aceasta, acest material ar trebui să fie inclus într-un manual de regresie bun.
- @mugen, ' ești binevenit. Nu ezitați să puneți mai multe întrebări prin intermediul mecanismelor normale (făcând clic pe
ASK QUESTION
); vor exista mai multe resurse pentru a răspunde, veți atrage atenția mai multor CVers, & informațiile vor fi mai accesibile pentru posteritate.