Ich mache eine lineare Regression mit einer transformierten abhängigen Variablen. Die folgende Transformation wurde durchgeführt, damit die Normalität der Residuen angenommen wird Die nicht transformierte abhängige Variable war negativ verzerrt, und die folgende Transformation machte sie nahezu normal:
$$ Y = \ sqrt {50-Y_ {orig}} $$
wobei $ Y_ {orig} $ die abhängige Variable von der ursprünglichen Skala ist.
Ich denke, es ist sinnvoll, eine Transformation der $ \ beta $ -Koeffizienten zu verwenden, um zur ursprünglichen Skala zurückzukehren. Unter Verwendung der folgenden Regressionsgleichung
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
und durch Fixieren von $ X = 0 $, wir haben
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
Und schließlich ,
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
Mit der gleichen Logik fand ich
$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$
Jetzt funktionieren die Dinge sehr gut für ein Modell mit 1 oder 2 Prädiktoren; Die rücktransformierten Koeffizienten ähneln den ursprünglichen, nur jetzt kann ich den Standardfehlern vertrauen. Das Problem tritt auf, wenn ein Interaktionsbegriff wie
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$ p eingefügt wird >
Dann sind die Rücktransformationen für die $ \ beta $ s nicht so nah an denen der ursprünglichen Skala, und ich bin mir nicht sicher, warum das passiert. Ich bin mir auch nicht sicher, ob die Formel für Rück- gefunden wurde. Die Transformation eines Beta-Koeffizienten ist wie für das 3. $ \ beta $ (für den Interaktionsterm) verwendbar. Bevor ich in die verrückte Algebra ging, dachte ich, ich würde um Rat fragen …
Kommentare
- Wie definieren Sie $ \ alpha_ {orig} $ und $ \ beta_ {orig} $?
- Wie der Wert von Alpha und Beta auf den ursprünglichen Skalen
- Aber was bedeutet das?
- Für mich Das scheint ein bedeutungsloses Konzept zu sein. Ich stimme der Antwort von gung ' zu.
Antwort
Ein Problem ist, dass Sie
$$ Y = α + β⋅X $$
geschrieben haben. Dies ist eine einfache Deterministik (dh nicht zufällig) ) Modell. In diesem Fall könnten Sie die Koeffizienten auf der ursprünglichen Skala zurücktransformieren, da es sich nur um eine einfache Algebra handelt In der üblichen Regression haben Sie jedoch nur $ E (Y | X) = α + β⋅X $; Sie haben den Fehlerterm aus Ihrem Modell herausgelassen. Wenn die Transformation von $ Y $ zurück zu $ Y_ {orig} $ nicht linear ist, liegt möglicherweise ein Problem vor, da $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , im Allgemeinen. Ich denke, das hat möglicherweise mit der Diskrepanz zu tun, die Sie sehen.
Bearbeiten: Beachten Sie dies Wenn die Transformation linear ist, können Sie eine Rücktransformation durchführen, um Schätzungen der Koeffizienten auf der ursprünglichen Skala zu erhalten, da die Erwartung linear ist.
Kommentare
- + 1 zur Erklärung von warum wir ' die Betas nicht zurücktransformieren können.
Antwort
Ich begrüße Ihre Bemühungen hier, aber Sie bellen den falschen Baum an. Sie transformieren Betas nicht zurück. Ihr Modell hält in der transformierten Datenwelt. Wenn Sie beispielsweise eine Vorhersage treffen möchten, transformieren Sie $ \ hat {y} _i $ zurück, aber das ist es. Natürlich können Sie auch ein Vorhersageintervall erhalten, indem Sie die oberen und unteren Grenzwerte berechnen und sie dann ebenfalls zurücktransformieren, aber in keinem Fall transformieren Sie die Betas zurück.
Kommentare
- Was ist mit der Tatsache zu tun, dass die rücktransformierten Koeffizienten denen sehr nahe kommen, die bei der Modellierung der nicht transformierten Variablen erhalten wurden? Weiß ' nicht, dass Rückschlüsse auf die ursprüngliche Skala möglich sind?
- Ich weiß ' nicht genau. Es könnte eine beliebige Anzahl von Dingen abhängen. Meine erste Vermutung ist, dass Sie ' mit Ihren ersten Betas Glück haben, aber dann geht Ihnen das Glück aus. Ich muss w / @ mark999 zustimmen, dass " die Schätzungen, die wir ' erhalten würden, die ursprünglichen Daten waren, die für die lineare Regression " macht ' keinen Sinn; Ich wünschte, es wäre &, es scheint auf den ersten Blick rot zu werden, aber leider nicht ' t. Und ' lizenziert keine Schlussfolgerungen auf der ursprünglichen Skala.
- @gung für nichtlineare Transformationen (z. B. Box Cox): Ich kann angepasste Werte als zurück transformieren sowie Vorhersageintervalle, aber ich kann ' weder Betas noch Koeffizientenintervalle für die Betas transformieren. Gibt es zusätzliche Einschränkungen, die ich beachten sollte? Übrigens, dies ist ein sehr interessantes Thema, wo kann ich es besser verstehen?
- @mugen, ' ist schwer zu sagen, was Sie sonst noch wissen sollten von.Eine Sache, die Sie vielleicht beachten sollten, ist, dass die Rückentransformation von y-hat Ihnen den bedingten Median gibt, während der nicht rücktransformierte (bleck) y-Hut das bedingte Mittel ist. Abgesehen davon sollte dieses Material in einem guten Regressionslehrbuch behandelt werden.
- @mugen, Sie ' sind willkommen. Fühlen Sie sich frei, weitere Fragen über die normalen Mechanismen zu stellen (klicken Sie auf
ASK QUESTION
); Es wird mehr Ressourcen für die Beantwortung geben, Sie werden die Aufmerksamkeit von mehr CVern erhalten, & die Informationen werden für die Nachwelt besser zugänglich sein.