Interpretation der positiven und negativen Beta-Gewichte in der Regressionsgleichung

Ich habe diese elementare Frage per E-Mail erhalten:

In einer Regressionsgleichung habe ich Recht, wenn der Beta-Wert positiv ist, hat die abhängige Variable als Reaktion auf eine stärkere Verwendung der unabhängigen Variablen zugenommen, und wenn negativ, hat die abhängige Variable als Reaktion auf eine Zunahme von abgenommen die unabhängige Variable – ähnlich wie Sie Korrelationen lesen?

Kommentare

  • @Jeromy, Mit Beta-Gewichten meinen Sie die linearen Regressionskoeffizienten?
  • @mp Üblicherweise sind Betas die Koeffizienten, wenn alle Variablen standardisiert wurden. (Das sollte sie sofort als Teilkorrelationen erkennbar machen und die Frage beantworten … 🙂
  • @ayush Mir ist klar, dass es sich um eine elementare Frage handelt. Sie können sie also nicht selbst beantworten. Ich denke jedoch, dass die Website von Fragen in verschiedenen Schwierigkeitsgraden profitieren kann. und ich ‚ möchte meine eigene Antwort hinzufügen, nachdem ich anderen die Möglichkeit gegeben habe, auf einige allgemeine Fragen zu antworten.
  • Guter Punkt, @Jeromy. Ich ‚ bin mir sicher, dass @ayush keinen solchen Kommentar abgegeben hätte (der leicht als unhöflich oder schlimmer interpretiert werden könnte), wenn dieselbe Frage von einem neuen Benutzer gestellt würde. Lassen Sie ‚ dies als Beweis für Ihr hohes Ansehen hier nehmen und prüfen, ob eine der Antworten dazu beiträgt, Ihren Korrespondenten aufzuklären.
  • @whuber. guter Punkt. Als Statistikberater in Psychologie bekomme ich manchmal Fragen per E-Mail, die ziemlich elementar sind. Meine ideale Situation ist es, solche Studenten zu ermutigen, direkt hier zu posten. Im Allgemeinen beantworte ich diese Fragen lieber auf dieser Website, als eine E-Mail-Antwort an den Schüler zu senden. Auf diese Weise kann meine Antwort eine fortlaufende Ressource für das Internet sein, und andere können eine noch bessere Antwort finden.

Antwort

Bei der Erklärung der Bedeutung des Regressionskoeffizienten fand ich die folgende Erklärung sehr nützlich. Angenommen, wir haben die Regression

$$ Y = a + bX $$

Sagen wir, $ X $ ändert sich um $ \ Delta X $ und $ Y $ ändert sich um $ \ Delta Y $ . Da wir die lineare Beziehung haben, haben wir

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Da $ Y = a + bX $, erhalten wir das

$$ \ Delta Y = b \ Delta X. $$

Wenn dies positiv ist, führt dies zu einer positiven Änderung von $ X $ positive Veränderung in $ Y $. Wenn $ b $ negativ ist, führt eine positive Änderung von $ X $ zu einer negativen Änderung von $ Y $.

Hinweis: Ich habe diese Frage als pädagogisch behandelt, dh eine einfache Erklärung geliefert.

Anmerkung 2: Wie von @whuber ausgeführt, hat diese Erklärung eine wichtige Annahme, dass die Beziehung für alle möglichen Werte von $ X $ und $ Y $ gilt. In Wirklichkeit ist dies eine sehr einschränkende Annahme, andererseits gilt die Erklärung für kleine Werte von $ \ Delta X $, da der Taylor-Satz besagt, dass Beziehungen, die als differenzierbare Funktionen ausgedrückt werden können (und dies eine vernünftige Annahme ist) ) sind lokal linear.

Kommentare

  • … vorausgesetzt, das Verhalten ist über den gesamten Bereich von $ X $ -Werten wirklich linear! (Eine vorsichtigere Antwort könnte die gleiche Idee in Bezug auf durchschnittliche Änderungen formulieren und auch jeden Hinweis darauf vermeiden, dass die Beziehung kausal ist.)
  • @whuber, ich wusste, dass das Setzen der Das beste Wort war keine kluge Wahl 🙂 Vielen Dank für Ihren Kommentar. ‚ Ich werde versuchen, die Antwort neu zu formulieren.
  • @mp “ Am besten “ ist ‚ nicht unbedingt ein Problem. Ich ‚ versuche nur, es Ihnen schwer zu machen 🙂 (Aber “ induziert “ hat meine Aufmerksamkeit erregt …) Wenn Sie ‚ wirklich nach dem “ besten “ Erklärung, erinnern Sie sich, dass ein häufiger Punkt der Verwirrung unter den Uneingeweihten die Interpretation von Interaktionskoeffizienten ist: Schließlich können Sie ‚ nicht unabhängig voneinander variieren (sagen wir) $ XY $; Sie tun dies, indem Sie entweder $ X $ oder $ Y $ oder beides variieren. Eine Erklärung, die mit dieser Situation umgeht, wäre daher sehr willkommen.
  • @whuber, ja induzieren war eine schlechte Wahl. Ich ‚ überlasse die Erklärung der Interaktionsterme jemand anderem 🙂
  • @mp re Anmerkung 2: Ah, Taylor ‚ s! Aber reale Daten sind ‚ nicht einmal kontinuierlich, viel weniger differenzierbar. Das Modell kann diese mathematischen Eigenschaften genießen. Insbesondere bei Erklärungen für Uneingeweihte kann es sinnvoll sein, das Verhalten des Modells ‚ von dem Verhalten zu unterscheiden, das wir von den Daten erwarten.Außerdem sagt der Satz von Taylor ‚ wenig über den Bereich von $ X $ -Werten aus, über den nahezu Linearität gilt. Das Regressionsmodell sagt, dass dieser Bereich unendlich ist!

Antwort

Wie @gung bemerkt, gibt es unterschiedliche Konventionen bezüglich die Bedeutung von ($ \ beta $, dh „beta“). In der breiteren statistischen Literatur wird Beta häufig verwendet, um nicht standardisierte Koeffizienten darzustellen. In der Psychologie (und vielleicht auch in anderen Bereichen) wird jedoch häufig zwischen b für nicht standardisierte und beta für standardisierte Koeffizienten unterschieden. Diese Antwort setzt voraus, dass der Kontext angibt, dass Beta standardisierte Koeffizienten darstellt:

  • Beta-Gewichte: Wie @whuber erwähnt hat, sind „Beta-Gewichte“ standardmäßig standardisierte Regressionskoeffizienten (siehe Wikipedia zum standardisierten Koeffizienten ). In diesem Zusammenhang wird $ b $ häufig für nicht standardisierte Koeffizienten und $ \ beta $ häufig für standardisierte Koeffizienten verwendet.

  • Grundlegende Interpretation : Ein Beta-Gewicht für eine bestimmte Prädiktorvariable ist die vorhergesagte Differenz der Ergebnisvariablen in Standardeinheiten für eine Erhöhung um eine Standardabweichung für die angegebene Prädiktorvariable, die alle anderen Prädiktoren enthält Konstante.

  • Allgemeine Ressource zur multiplen Regression: Die Frage ist elementar und impliziert, dass Sie allgemeines Material zur multiplen Regression lesen sollten ( hier ist eine elementare Beschreibung von Andy Field ).

  • Kausalität: Achten Sie auf eine Sprache wie „Die abhängige Variable hat aufgrund der stärkeren Verwendung der unabhängigen Variablen zugenommen“. . Eine solche Sprache hat kausale Konnotationen. Beta-Gewichte allein reichen nicht aus, um eine kausale Interpretation zu rechtfertigen. Sie würden zusätzliche Beweise benötigen, um eine kausale Interpretation zu rechtfertigen.

Kommentare

  • +1 Beachten Sie jedoch, dass dort sind unterschiedliche Konventionen in Bezug auf die Verwendung von Begriffen in der Statistik. Beispielsweise wird ‚ beta ‚ / $ \ beta $ häufig verwendet, um den wahren Parameter zu bezeichnen, der den Datengenerierungsprozess steuert, & ‚ Beta-Hut ‚ / $ \ hat \ beta $ bezieht sich auf die in berechnete Steigungsschätzung Ihre Probe. In diesem Fall bedeuten sie nicht, dass die Variablen zuerst standardisiert wurden. Diese unterschiedliche Verwendung ist unglücklich, aber dennoch real. Es ist wichtig, klar zu machen, wie Begriffe verwendet werden, wenn man ihnen begegnet, anstatt davon auszugehen, dass jeder das Gleiche bedeutet.
  • @gung good point; Ich ‚ habe meine Antwort aktualisiert, um dies zu berücksichtigen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.