変換された従属変数を使用して線形回帰を実行しています。残差の正規性を仮定するために、次の変換が行われました。変換されていない従属変数は負に歪んでおり、次の変換によって通常に近くなりました。
$$ Y = \ sqrt {50-Y_ {orig}} $$
ここで、$ Y_ {orig} $は元のスケールの従属変数です。
$ \ beta $係数に何らかの変換を使用して、元のスケールに戻るのは理にかなっていると思います。次の回帰式を使用して、
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
そして$ X =を修正します。 0 $、
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
そして最後に、
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
同じロジックを使用して、
$$ \ beta_ {を見つけました。 orig} = \ alpha \ space(\ alpha-2 \ beta)+ \ beta ^ 2 + \ alpha_ {orig} -50 $$
これで、 1つまたは2つの予測子を持つモデル。逆変換された係数は元の係数に似ていますが、標準誤差を信頼できるのは今だけです。問題は、
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$ pなどの交互作用項を含めるときに発生します。 >
次に、$ \ beta $ sの逆変換は、元のスケールからの逆変換にそれほど近くなく、なぜそれが発生するのかわかりません。また、逆変換の式が見つかったかどうかもわかりません。ベータ係数の変換は、3番目の$ \ beta $(交互作用項)の場合と同じように使用できます。クレイジーな代数に入る前に、私はアドバイスを求めたいと思いました…
コメント
- $ \ alpha_ {orig}をどのように定義しますか$と$ \ beta_ {orig} $?
- 元のスケールでのアルファとベータの値として
- しかし、それはどういう意味ですか?
- 私にとってそれは無意味な概念のようです。私はgung 'の答えに同意します。
答え
1つの問題はあなたが書いたことです
$$ Y =α+β⋅X$$
これは単純な決定論的です(つまり、ランダムではありません) )モデル。その場合、は元のスケールで係数を逆変換できます。これは単純な代数の問題だからです。 。しかし、通常の回帰では、$ E(Y | X)=α+β⋅X$しかありません。モデルから誤差項を除外しました。 $ Y $から$ Y_ {orig} $への変換が非線形の場合、$ E \ big(f(X)\ big)≠f \ big(E(X)\ big)$であるため、問題が発生する可能性があります。 、 一般に。それはあなたが見ている矛盾に関係しているのではないかと思います。
編集:注意してください変換が線形の場合、期待値は線形であるため、逆変換して元のスケールの係数の推定値を取得できます。
コメント
- + 1 理由を説明するために'ベータを逆変換することはできません。
回答
ここであなたの努力に敬意を表しますが、あなたは間違った木を吠えています。ベータ版を逆変換しません。モデルは変換されたデータの世界に保持されます。たとえば、予測を行いたい場合は、$ \ hat {y} _i $を逆変換しますが、それだけです。もちろん、上限値と下限値を計算して予測区間を取得し、それらを逆変換することもできますが、ベータを逆変換することはありません。
コメント
- 逆変換された係数が、変換されていない変数をモデル化したときに得られた係数に非常に近くなるという事実をどうすればよいですか? '元のスケールでの推論が可能ではありませんか?
- 正確にはわかりません'。それはいくつものことに依存する可能性があります。私の最初の推測では、'最初のいくつかのベータ版で幸運を手に入れていますが、運が尽きます。 "私たちが'取得した推定値は、線形回帰に適した元のデータであることに同意する必要があります"は'実際には意味がありません。 &は一見赤面しているように見えますが、残念ながら'ではありません。また、'元のスケールでの推論のライセンスはありません。
- 非線形変換(ボックスコックスなど)の場合は@gung:近似値を次のように逆変換できます。予測区間も同様ですが、'ベータまたはベータの係数間隔を変換できません。注意すべき追加の制限はありますか?ところで、これは非常に興味深いトピックです。どこで理解を深めることができますか?
- @mugen、'他に知っておくべきことを言うのは難しいですの。覚えておくべき1つのことは、y-hatの逆変換は条件付きの中央値を与えるのに対し、逆変換されていない(bleck)y-hatは条件付き平均であるということです。 それ以外は、この資料は優れた回帰教科書でカバーされている必要があります。
- @mugen、'どういたしまして。 通常のメカニズム(
ASK QUESTION
をクリック)を使用して、さらに質問してください。 回答するためのリソースが増え、より多くのCVerの注目を集めるようになり、&後世のために情報にアクセスしやすくなります。