Was ist der Unterschied zwischen $ \ beta_1 $ und $ \ hat {\ beta} _1 $?

Angenommen, ich habe eine Zufallsstichprobe $ \ lbrace x_n, y_n \ rbrace_ {n = 1} ^ N $.

Angenommen, $$ y_n = \ beta_0 + \ beta_1 x_n + \ varepsilon_n $$

und $$ \ hat {y} _n = \ hat {\ beta} _0 + \ hat {\ beta} _1 x_n $$

Was ist der Unterschied zwischen $ \ beta_1 $ und $ \ hat {\ beta} _1 $?

Kommentare

  • $ \ beta $ ist Ihr tatsächlicher Koeffizient und $ \ hat {\ beta} $ ist Ihr Schätzer für $ \ beta $.
  • Isn ‚ Ist dies nicht ein Duplikat eines früheren Beitrags? Ich wäre überrascht …

Antwort

$ \ beta_1 $ ist eine Idee – das tut sie nicht existieren tatsächlich in der Praxis. Aber wenn die Gauß-Markov-Annahme zutrifft, würde $ \ beta_1 $ Ihnen diese optimale Steigung mit Werten darüber und darunter auf einer vertikalen „Schicht“ vertikal zur abhängigen Variablen geben, die eine schöne normale Gaußsche Verteilung der Residuen bildet. $ \ hat \ beta_1 $ ist die Schätzung von $ \ beta_1 $ basierend auf der Stichprobe.

Die Idee ist, dass Sie mit einer Stichprobe aus einer Population arbeiten. Ihre Stichprobe bildet eine Datenwolke, wenn Sie so wollen Eine der Dimensionen entspricht der abhängigen Variablen, und Sie versuchen, die Linie anzupassen, die die Fehlerterme minimiert. In OLS ist dies die Projektion der abhängigen Variablen auf den Vektorunterraum, der durch den Spaltenraum der Modellmatrix gebildet wird Schätzungen der Populationsparameter werden mit dem Symbol $ \ hat \ beta $ gekennzeichnet. Je mehr Datenpunkte Sie haben, desto genauer sind die geschätzten Koeffizienten, $ \ hat \ beta_i $ und die Wette Nach der Schätzung dieser idealisierten Populationskoeffizienten ist $ \ beta_i $.

Hier ist der Unterschied in den Steigungen ($ \ beta $ gegenüber $ \ hat \ beta $) zwischen der „Population“ in Blau und der Beispiel in isolierten schwarzen Punkten:

Geben Sie hier die Bildbeschreibung ein

Die Regressionslinie ist gepunktet und schwarz, während die synthetisch perfekte „Populations“ -Linie durchgehend blau ist. Die Fülle an Punkten liefert ein taktiles Gefühl für die Normalität der Residuenverteilung.

Antwort

Die “ hat “ Symbol bezeichnet im Allgemeinen eine Schätzung im Gegensatz zum “ true “ Wert. Daher ist $ \ hat {\ beta} $ eine Schätzung von $ \ beta $ . Einige Symbole haben ihre eigenen Konventionen: Die Stichprobenvarianz wird beispielsweise häufig als $ s ^ 2 $ und nicht als geschrieben $ \ hat {\ sigma} ^ 2 $ , obwohl einige Leute beide verwenden, um zwischen voreingenommenen und unvoreingenommenen Schätzungen zu unterscheiden.

In Ihrem speziellen Fall ist der $ \ hat {\ beta} $ -Werte sind Parameterschätzungen für ein lineares Modell. Das lineare Modell nimmt an, dass die Ergebnisvariable $ y $ durch eine lineare Kombination der Datenwerte $ x_i $ s, jeweils gewichtet mit dem entsprechenden Wert $ \ beta_i $ (plus einem Fehler $ \ epsilon $ ) $$ y = \ beta_0 + \ beta_1x_1 + \ beta_2 x_2 + \ cdots + \ beta_n x_n + \ epsilon $$

In der Praxis Natürlich sind die “ true “ $ \ beta $ -Werte normalerweise unbekannt und möglicherweise gar nicht vorhanden (möglicherweise werden die Daten nicht von einem linearen Modell generiert). Trotzdem können wir Werte aus den Daten schätzen, die sich $ y $ annähern, und diese Schätzungen werden als $ \ hat {\ beta bezeichnet } $ .

Antwort

Die Gleichung $$ y_i = \ beta_0 + \ beta_1 x_i + \ epsilon_i $ $

wird als das wahre Modell bezeichnet. Diese Gleichung besagt, dass die Beziehung zwischen der Variablen $ x $ und der Variablen $ y $ durch eine Linie $ y = \ beta_0 + \ beta_1x $ erklärt werden kann. Da beobachtete Werte jedoch aufgrund von Fehlern niemals genau dieser Gleichung folgen werden, wird ein zusätzlicher $ \ epsilon_i $ -Fehlerterm hinzugefügt, um Fehler anzuzeigen. Die Fehler können als natürliche Abweichungen von der Beziehung von $ x $ und $ y $ interpretiert werden. Unten zeige ich zwei Paare von $ x $ und $ y $ (die schwarzen Punkte sind Daten). Im Allgemeinen kann man sehen, dass mit zunehmendem $ x $ $ y $ zunimmt. Für beide Paare lautet die wahre Gleichung $$ y_i = 4 + 3x_i + \ epsilon_i $$, aber die beiden Diagramme weisen unterschiedliche Fehler auf. Das Diagramm links weist große Fehler und das Diagramm rechts kleine Fehler auf (da die Punkte enger sind). (Ich kenne die wahre Gleichung, weil ich die Daten selbst generiert habe. Im Allgemeinen kennen Sie die wahre Gleichung nie.) Geben Sie hier die Bildbeschreibung ein

Sehen wir uns die Handlung links an. Das wahre $ \ beta_0 = 4 $ und das wahre $ \ beta_1 $ = 3.In der Praxis kennen wir jedoch die Wahrheit nicht, wenn wir Daten erhalten. schätzen die Wahrheit. Wir schätzen $ \ beta_0 $ mit $ \ hat {\ beta} _0 $ und $ \ beta_1 $ mit $ \ hat {\ beta} _1 $. Abhängig davon, welche statistischen Methoden verwendet werden, können die Schätzungen sehr unterschiedlich sein. In der Regressionseinstellung sind die Schätzungen erhalten über eine Methode namens Ordinary Least Squares. Dies wird auch als Methode der Linie der besten Anpassung bezeichnet. Grundsätzlich müssen Sie die Linie zeichnen, die am besten zu den Daten passt. Ich diskutiere hier keine Formeln, sondern verwende die Formel für OLS. Sie erhalten

$$ \ hat {\ beta} _0 = 4.809 \ quad \ text {und} \ quad \ hat {\ beta} _1 = 2.889 $$

und das Ergebnis Die Zeile mit der besten Anpassung lautet: Geben Sie hier die Bildbeschreibung ein.

Ein einfaches Beispiel wäre die Beziehung zwischen der Größe von Müttern und Töchtern. Lassen Sie $ x = $ Größe von Müttern und $ y $ = Größe von Töchtern. Natürlich würde man größere Mütter erwarten größere Töchter zu haben (aufgrund genetischer Ähnlichkeit). Glauben Sie jedoch, dass eine Gleichung die Größe einer Mutter und einer Tochter genau zusammenfassen kann, sodass ich, wenn ich die Größe der Mutter kenne, die exakte Größe der Tochter vorhersagen kann? Andererseits kann man die Beziehung möglicherweise mit Hilfe einer in einer durchschnittlichen -Anweisung zusammenfassen.

TL DR: $ \ beta $ ist die Wahrheit der Bevölkerung. Es repräsentiert die unbekannte Beziehung zwischen $ y $ und $ x $. Da wir nicht immer alle möglichen Werte von $ y $ und $ x $ erhalten können, sammeln wir eine Stichprobe aus der Grundgesamtheit und versuchen, $ \ beta $ unter Verwendung der Daten. $ \ hat {\ beta} $ ist unsere Schätzung. Es ist eine Funktion der Daten. $ \ beta $ ist keine Funktion der Daten, sondern die Wahrheit.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.