Supponiamo di avere un campione casuale $ \ lbrace x_n, y_n \ rbrace_ {n = 1} ^ N $.
Supponiamo $$ y_n = \ beta_0 + \ beta_1 x_n + \ varepsilon_n $$
e $$ \ hat {y} _n = \ hat {\ beta} _0 + \ hat {\ beta} _1 x_n $$
Qual è la differenza tra $ \ beta_1 $ e $ \ hat {\ beta} _1 $?
Commenti
- $ \ beta $ è il tuo coefficiente effettivo e $ \ hat {\ beta} $ è il tuo stimatore di $ \ beta $.
- Isn ‘ Questo è un duplicato di un post precedente? Sarei sorpreso …
Risposta
$ \ beta_1 $ è unidea, non “t esistono davvero nella pratica, ma se lipotesi di Gauss-Markov fosse valida, $ \ beta_1 $ ti darebbe quella pendenza ottimale con valori sopra e sotto di essa su una “fetta” verticale verticale alla variabile dipendente che forma una bella distribuzione gaussiana normale dei residui. $ \ hat \ beta_1 $ è la stima di $ \ beta_1 $ basata sul campione.
Lidea è che stai lavorando con un campione di una popolazione. Il tuo campione forma una nuvola di dati, se vuoi . Una delle dimensioni corrisponde alla variabile dipendente e si cerca di adattare la linea che minimizza i termini di errore – in OLS, questa è la proiezione della variabile dipendente sul sottospazio vettoriale formato dallo spazio delle colonne della matrice del modello. le stime dei parametri della popolazione sono indicate con il simbolo $ \ hat \ beta $. Più punti dati hai, più accurati sono i coefficienti stimati, $ \ hat \ beta_i $ e la scommessa ter la stima di questi coefficienti di popolazione idealizzati, $ \ beta_i $.
Ecco la differenza nelle pendenze ($ \ beta $ contro $ \ hat \ beta $) tra la “popolazione” in blu e la campione in punti neri isolati:
La linea di regressione è punteggiata e in nero, mentre la linea “popolazione” sinteticamente perfetta è in blu pieno. Labbondanza di punti fornisce un senso tattile della normalità della distribuzione dei residui.
Risposta
Il ” hat ” simbolo generalmente denota una stima, al contrario del ” true ” valore. Pertanto $ \ hat {\ beta} $ è una stima di $ \ beta $ . Alcuni simboli hanno le proprie convenzioni: la varianza del campione, ad esempio, è spesso scritta come $ s ^ 2 $ , non $ \ hat {\ sigma} ^ 2 $ , anche se alcune persone li usano entrambi per distinguere tra stime distorte e imparziali.
Nel tuo caso specifico, $ \ hat {\ beta} $ i valori sono stime di parametri per un modello lineare. Il modello lineare suppone che la variabile di risultato $ y $ sia generata da una combinazione lineare dei valori dei dati $ x_i $ s, ciascuno ponderato dal valore $ \ beta_i $ corrispondente (più qualche errore $ \ epsilon $ ) $$ y = \ beta_0 + \ beta_1x_1 + \ beta_2 x_2 + \ cdots + \ beta_n x_n + \ epsilon $$
In pratica, ovviamente, i valori ” true ” $ \ beta $ di solito sono sconosciuto e potrebbe anche non esistere (forse i dati non sono generati da un modello lineare). Tuttavia, possiamo stimare i valori dai dati che approssimano $ y $ e queste stime sono indicate come $ \ hat {\ beta } $ .
Risposta
Lequazione $$ y_i = \ beta_0 + \ beta_1 x_i + \ epsilon_i $ $
è ciò che viene definito il vero modello. Questa equazione dice che la relazione tra la variabile $ x $ e la variabile $ y $ può essere spiegata da una linea $ y = \ beta_0 + \ beta_1x $. Tuttavia, poiché i valori osservati non seguiranno mai quellequazione esatta (a causa di errori), viene aggiunto un ulteriore termine di errore $ \ epsilon_i $ per indicare gli errori. Gli errori possono essere interpretati come deviazioni naturali dalla relazione di $ x $ e $ y $. Di seguito mostro due coppie di $ x $ e $ y $ (i punti neri sono dati). In generale si può vedere che allaumentare di $ x $ aumenta $ y $. Per entrambe le coppie, la vera equazione è $$ y_i = 4 + 3x_i + \ epsilon_i $$ ma i due grafici hanno errori diversi. La trama a sinistra ha grandi errori e la trama a destra piccoli errori (perché i punti sono più stretti). (Conosco la vera equazione perché ho generato i dati da solo. In generale, non si conosce mai la vera equazione)
Diamo unocchiata al grafico a sinistra. Il vero $ \ beta_0 = 4 $ e il vero $ \ beta_1 $ = 3.Ma in pratica, quando vengono forniti i dati, non conosciamo la verità. Quindi stimiamo la verità. Stimiamo $ \ beta_0 $ con $ \ hat {\ beta} _0 $ e $ \ beta_1 $ con $ \ hat {\ beta} _1 $. A seconda dei metodi statistici utilizzati, le stime possono essere molto diverse. Nellimpostazione di regressione, le stime sono ottenuto tramite un metodo chiamato Minimi quadrati ordinari. Questo è anche noto come il metodo della linea di migliore adattamento. Fondamentalmente, è necessario disegnare la linea che si adatta meglio ai dati. Non sto discutendo di formule qui, ma usando la formula per OLS ottieni
$$ \ hat {\ beta} _0 = 4.809 \ quad \ text {e} \ quad \ hat {\ beta} _1 = 2.889 $$
e il risultato la riga che meglio si adatta è
Un semplice esempio potrebbe essere la relazione tra le altezze delle madri e delle figlie. Siano $ x = $ altezza delle madri e $ y $ = altezza delle figlie. Naturalmente, ci si aspetterebbe madri più alte avere figlie più alte (a causa della somiglianza genetica). Tuttavia, pensi che unequazione possa riassumere esattamente laltezza di una madre e di una figlia, in modo che se conosco laltezza della madre sarò in grado di prevedere laltezza esatta della figlia? No. Daltra parte, si potrebbe essere in grado di riassumere la relazione con laiuto di un su unistruzione media.
TL DR: $ \ beta $ è la verità sulla popolazione. Rappresenta la relazione sconosciuta tra $ y $ e $ x $. Poiché non è sempre possibile ottenere tutti i valori possibili di $ y $ e $ x $, raccogliamo un campione dalla popolazione e proviamo a stimare $ \ beta $ utilizzando i dati. $ \ hat {\ beta} $ è la nostra stima. È una funzione dei dati. $ \ beta $ non è una funzione dei dati, ma la verità.