Transformarea înapoi a coeficienților de regresie

Eu „fac o regresie liniară cu o variabilă dependentă transformată. Următoarea transformare a fost făcută astfel încât asumarea normalității reziduurilor Variabila dependentă netransformată a fost înclinată negativ și următoarea transformare a făcut-o aproape de normal:

$$ Y = \ sqrt {50-Y_ {orig}} $$

unde $ Y_ {orig} $ este variabila dependentă de scara originală.

Cred că are sens să folosim o oarecare transformare a coeficienților $ \ beta $ pentru a ne întoarce la scara originală. Folosind următoarea ecuație de regresie,

$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$

și fixând $ X = 0 $, avem

$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$

Și în sfârșit ,

$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$

Folosind aceeași logică, am găsit

$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$

Acum lucrurile funcționează foarte bine pentru un model cu 1 sau 2 predictori; coeficienții transformați înapoi seamănă cu cei originali, abia acum pot avea încredere în erorile standard. Problema apare atunci când se include un termen de interacțiune, cum ar fi

$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$

Atunci transformarea înapoi pentru $ \ beta $ s nu este atât de apropiată de cele din scara originală și „nu sunt sigur de ce se întâmplă acest lucru. De asemenea, nu sunt sigur dacă formula găsită pentru back- transformarea unui coeficient beta este utilizabilă ca și pentru al treilea $ \ beta $ (pentru termenul de interacțiune). Înainte de a intra în algebră nebună, m-am gândit să „cer sfaturi …

Comentarii

  • Cum definiți $ \ alpha_ {orig} $ și $ \ beta_ {orig} $?
  • Ca valoare alfa și beta pe scările originale
  • Dar ce înseamnă asta?
  • Pentru mine acesta pare un concept fără sens. Sunt de acord cu răspunsul gung '.

Răspuns

O problemă este că ați scris

$$ Y = α + β⋅X $$

Acesta este un determinist simplu (adică non-aleatoriu ) model. În acest caz, ați putea transforma înapoi coeficienții pe scara originală, deoarece este doar o chestiune de o algebră simplă Dar, în regresia obișnuită, aveți doar $ E (Y | X) = α + β⋅X $; ați lăsat termenul de eroare în afara modelului dvs. Dacă transformarea din $ Y $ înapoi în $ Y_ {orig} $ este neliniară, este posibil să aveți o problemă din moment ce $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , în general. Cred că acest lucru poate avea legătură cu discrepanța pe care o vedeți.

Editați: Rețineți că dacă transformarea este liniară, puteți transforma înapoi pentru a obține estimări ale coeficienților pe scara originală, deoarece așteptarea este liniară.

Comentarii

  • + 1 pentru a explica de ce putem ' să transformăm înapoi beta-urile.

Răspuns

Vă salut eforturile aici, dar sunteți lătrat în copacul greșit. Nu transformați înapoi versiunile. Modelul dvs. se menține în lumea datelor transformate. Dacă doriți să faceți o predicție, de exemplu, transformați înapoi $ \ hat {y} _i $, dar asta este. Desigur, puteți obține, de asemenea, un interval de predicție calculând valorile limită superioară și inferioară și apoi transformați-le și înapoi, dar în niciun caz nu transformați înapoi beta-urile.

Comentarii

  • Ce să facem din faptul că coeficienții transformați înapoi se apropie foarte mult de cei obținuți la modelarea variabilei netransformate? ' nu permite anumite inferențe la scara inițială?
  • Nu știu exact, ' Ar putea depinde orice număr de lucruri. Prima mea presupunere este că ' ai noroc cu primul tău cuplu de beta, dar apoi norocul tău se termină. Trebuie să fiu de acord cu @ mark999 că " estimările pe care le obținem ' erau datele originale potrivite pentru regresia liniară " nu are ' de fapt nici un sens; Mi-aș dori ca & pare să se înroșească la început, dar din păcate nu ' t. Și nu ' nu licențiază nicio inferență pe scara originală.
  • @gung pentru transformări neliniare (să zicem box cox): pot transforma înapoi valorile ajustate ca precum și intervale de predicție, dar nu pot ' t transforma beta și nici intervale de coeficient pentru beta. Există vreo limită suplimentară de care ar trebui să știu? btw, acesta este un subiect foarte interesant, unde pot obține o mai bună înțelegere?
  • @mugen, este ' greu de spus ce altceva ar trebui să fii conștient de.Un lucru pe care poate trebuie să-l țineți cont este că transformarea înapoi a y-hat vă oferă mediană condițională, în timp ce y-hat un-back-transformat (bleck) este media condițională. În afară de aceasta, acest material ar trebui să fie inclus într-un manual de regresie bun.
  • @mugen, ' ești binevenit. Nu ezitați să puneți mai multe întrebări prin intermediul mecanismelor normale (făcând clic pe ASK QUESTION); vor exista mai multe resurse pentru a răspunde, veți atrage atenția mai multor CVers, & informațiile vor fi mai accesibile pentru posteritate.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *