Minä teen lineaarisen regression muunnetun riippuvan muuttujan kanssa. Seuraava muunnos tehtiin niin, että oletus jäännösten normaaluudesta Transformoimaton riippuvainen muuttuja oli vinossa negatiivisesti, ja seuraavan muunnoksen ansiosta se oli lähellä normaalia:
$$ Y = \ sqrt {50-Y_ {orig}} $$
missä $ Y_ {orig} $ on riippuvainen muuttuja alkuperäisestä asteikosta.
Mielestäni on järkevää käyttää jonkin verran muunnosta $ \ beta $ -kertoimissa palataksemme takaisin alkuperäiseen asteikkoon. Käytä seuraavaa regressioyhtälöä,
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
ja korjaamalla $ X = 0 $, meillä on
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
Ja lopuksi ,
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
Samaa logiikkaa käyttämällä löysin
$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$
Nyt asiat toimivat hyvin malli, jossa on 1 tai 2 ennustinta; taaksepäin muunnetut kertoimet muistuttavat alkuperäisiä, vasta nyt voin luottaa vakiovirheisiin. Ongelma syntyy, kun sisällytetään vuorovaikutustermi, kuten
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$
Tällöin $ \ beta $ s: n takamuutos ei ole niin lähellä alkuperäisen asteikon muunnoksia, enkä ole varma, miksi näin tapahtuu. En myöskään ole varma, löytyykö kaavasta beeta-kertoimen muuntaminen on käyttökelpoinen kuten 3. $ \ beta $: lla (vuorovaikutustermillä). Ennen kuin menin hulluun algebraan, ajattelin kysyä neuvoa …
Kommentit
- Kuinka määrität $ \ alpha_ {orig} $ ja $ \ beta_ {orig} $?
- Alfa- ja beeta-arvona alkuperäisessä asteikossa
- Mutta mitä se tarkoittaa?
- Minulle se tuntuu merkityksettömältä käsitteeltä. Olen samaa mieltä gung ' vastauksesta.
Vastaa
Yksi ongelma on, että olet kirjoittanut
$$ Y = α + β⋅X $$
Se on yksinkertainen deterministinen (ts. ei-satunnainen ) malli. Tällöin voit muuttaa muuntokertoimet alkuperäisellä asteikolla, koska kyseessä on vain yksinkertainen algebra Mutta tavallisessa regressiossa sinulla on vain $ E (Y | X) = α + β⋅X $; olet jättänyt virhetermin pois mallistasi. Jos muunnos $ Y $: sta takaisin $ Y_ {orig} $: iin ei ole lineaarinen, sinulla saattaa olla ongelmia, koska $ E \ iso (f (X) \ iso) ≠ f \ iso (E (X) \ iso) $ , yleisesti. Luulen, että tämä voi liittyä näkemäsi ristiriitaan.
Muokkaa: Huomaa, että jos muunnos on lineaarinen, voit palauttaa muunnoksen saadaksesi arviot kertoimista alkuperäisellä asteikolla, koska odotus on lineaarinen.
Kommentit
- + 1 selittää miksi voimme ' t muuttaa muunnettuja beetoja.
Vastaa
Tervehdin ponnistelujasi täällä, mutta haukkaat väärää puuta. Et muuta muunnettua beetaa. Mallisi pysyy muunnetussa datamaailmassa. Jos esimerkiksi haluat tehdä ennusteen, muunnat takaisin $ \ hat {y} _i $, mutta se on siinä. Tietysti voit myös saada ennustevälin laskemalla korkeat ja matalat raja-arvot ja sitten muuntamalla ne myös takaisin, mutta missään tapauksessa et muuta muunnettuja beetoja.
Kommentit
- Mitä tehdä siitä, että taaksepäin muunnetut kertoimet tulevat hyvin lähelle muuntamattoman muuttujan mallinnuksessa saatuja? Eivätkö ' t, jotka sallivat jonkinlaisen johtopäätöksen alkuperäisessä mittakaavassa?
- En tiedä tarkalleen '. Se voi riippua monista asioista. Ensimmäinen arvaukseni on, että ' olet onnekas parillasi ensimmäisellä beetalla, mutta sitten onnesi loppuu. Minun on hyväksyttävä w / @ mark999, että " arviot, jotka saamme ' d, olivat alkuperäiset tiedot, jotka sopivat lineaariseen regressioon " ei ole mitään merkitystä; Toivon, että se & näyttää tavallaan ensin punastuvan, mutta valitettavasti se ei ' t. Ja se ei ' lisensioi mitään johtopäätöksiä alkuperäisessä mittakaavassa.
- @gung ei-lineaarisille muunnoksille (esimerkiksi box cox): Voin muuntaa sovitetut arvot samoin kuin ennustusvälit, mutta en voi ' t muuttaa beetoja eikä kertoimien välejä beetoille. Onko olemassa muita rajoituksia, joista minun pitäisi olla tietoisia? btw, tämä on erittäin mielenkiintoinen aihe, mistä saan paremman käsityksen?
- @mugen, on ' vaikea sanoa, mitä muuta sinun tulisi tietää /.Yksi asia, joka on ehkä pidettävä mielessä, on se, että y-hatun takamuutos antaa sinulle ehdollisen mediaanin , kun taas selkäpuolettomasti transformoitu (bleck) y-hattu on ehdollinen keskiarvo. Tämän lisäksi tämä materiaali tulisi käsitellä hyvässä regressio-oppikirjassa.
- @mugen, olet ' tervetullut. Voit kysyä lisää kysymyksiä tavallisten mekanismien kautta (napsauttamalla
ASK QUESTION
); vastaamiseen on enemmän resursseja, saat enemmän CVer-käyttäjien huomion, & jälkipolvien saatavilla olevat tiedot ovat paremmin käytettävissä.