Tilbake-transformasjon av regresjonskoeffisienter

Jeg gjør en lineær regresjon med en transformert avhengig variabel. Følgende transformasjon ble gjort slik at antagelsen om normalitet av residualer ville holde. Den utransformerte avhengige variabelen var negativt skjev, og den følgende transformasjonen gjorde den nær normal:

$$ Y = \ sqrt {50-Y_ {orig}} $$

der $ Y_ {orig} $ er den avhengige variabelen på den opprinnelige skalaen.

Jeg tror det er fornuftig å bruke litt transformasjon på $ \ beta $ -koeffisientene for å jobbe oss tilbake til den opprinnelige skalaen. Ved hjelp av følgende regresjonsligning,

$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$

og ved å fikse $ X = 0 $, vi har

$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$

Og til slutt ,

$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$

Ved å bruke samme logikk, fant jeg

$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$

Nå fungerer ting veldig bra for en modell med 1 eller 2 prediktorer; de baktransformerte koeffisientene ligner de originale, bare nå kan jeg stole på standardfeilene. Problemet oppstår når du inkluderer et samhandlingsuttrykk, for eksempel

$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$

Da er ikke transformasjonen for $ \ beta $ så nær de fra den opprinnelige skalaen, og jeg er ikke sikker på hvorfor det skjer. Jeg er også usikker på om formelen for bak- å transformere en beta-koeffisient er brukbar som for den tredje $ \ beta $ (for interaksjonsperioden). Før jeg gikk inn i gal algebra, tenkte jeg at jeg ville be om råd …

Kommentarer

  • Hvordan definerer du $ \ alpha_ {orig} $ og $ \ beta_ {orig} $?
  • Som verdien av alfa og beta på de originale skalaene
  • Men hva betyr det?
  • For meg det virker som et meningsløst konsept. Jeg er enig med gung ' s svar.

Svar

Et problem er at du har skrevet

$$ Y = α + β⋅X $$

Det er en enkel deterministisk (dvs. ikke-tilfeldig ) modell. I så fall kunne du transformere koeffisientene på den opprinnelige skalaen, siden det bare handler om en enkel algebra Men i vanlig regresjon har du bare $ E (Y | X) = α + β⋅X $; du har forlatt feiluttrykket utenfor modellen din. Hvis transformasjon fra $ Y $ tilbake til $ Y_ {orig} $ ikke er lineær, kan det hende du har et problem siden $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , generelt. Jeg tror det kan ha å gjøre med avviket du ser.

Rediger: Merk at hvis transformasjonen er lineær, kan du transformere tilbake for å få estimater av koeffisientene på den opprinnelige skalaen, siden forventningen er lineær.

Kommentarer

  • + 1 for å forklare hvorfor vi kan ' t tilbake forvandle betas.

Svar

Jeg hilser til innsatsen din her, men du bjeffer opp på feil tre. Du kan ikke transformere betaer. Modellen din holder i den transformerte dataverden. Hvis du for eksempel vil komme med en prediksjon, forvandler du $ \ hat {y} _i $, men det er det. Selvfølgelig kan du også få et prediksjonsintervall ved å beregne de høye og lave grenseverdiene, og deretter transformere dem også, men i ingen tilfeller forvandler du betaene.

Kommentarer

  • Hva skal jeg gjøre med at de baktransformerte koeffisientene kommer veldig nær de som oppnås når man modellerer den ikke-transformerte variabelen? Vet ikke ' t som tillater noe slutning på den originale skalaen?
  • Jeg vet ikke ', nøyaktig. Det kan avhenge av en rekke ting. Mitt første gjetning er at du ' blir heldig med ditt første par betaer, men så går lykken ut. Jeg må være enig w / @ mark999 for at " estimatene vi ' d får, var de originale dataene som var tilpasset lineær regresjon " gir ' ikke noe mening; Jeg skulle ønske det gjorde & det ser ut til å først rødme, men dessverre ' t. Og den ' t lisensierer noen slutninger på den opprinnelige skalaen.
  • @gung for ikke-lineære transformasjoner (si boks cox): Jeg kan tilbake transformere monterte verdier som samt prediksjonsintervaller, men jeg kan ' t transformere betas eller koeffisientintervaller for betas. Er det noen ytterligere begrensninger jeg bør være klar over? btw, dette er et veldig interessant tema, hvor kan jeg få bedre forståelse?
  • @mugen, det ' er vanskelig å si hva mer du bør være klar over av.En ting å huske på er at ryggtransformasjonen av y-hat gir deg den betingede medianen mens den ikke-rygg-transformerte (bleck) y-hatten er det betingede gjennomsnittet. Bortsett fra det, bør dette materialet dekkes i en god regresjonsbok.
  • @mugen, du ' er velkommen. Still gjerne flere spørsmål via de normale mekanismene (klikk ASK QUESTION); det vil være flere ressurser for å svare, du vil få oppmerksomhet fra flere CV-er, & informasjonen blir bedre tilgjengelig for ettertiden.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *