Interpretarea greutăților beta pozitive și negative în ecuația de regresie

Am primit această întrebare elementară prin e-mail:

Într-o ecuație de regresie, am dreptate când cred că dacă valoarea beta este pozitivă, variabila dependentă a crescut ca răspuns la o utilizare mai mare a variabilei independente și dacă este negativă, variabila dependentă a scăzut ca răspuns la o creștere variabila independentă – similară cu modul în care citești corelațiile?

Comentarii

  • @Jeromy, prin greutăți beta, înțelegeți coeficienții de regresie liniară?
  • @mp În mod convențional, beta sunt coeficienții atunci când toate variabilele au fost standardizate. (Asta ar trebui să le facă instantaneu recunoscute ca corelații parțiale, răspunzând la întrebare … 🙂
  • @ayush Îmi dau seama că este o întrebare elementară, așa că nu ezitați să nu răspundeți singur. Cu toate acestea, cred că site-ul poate beneficia de a avea întrebări la diferite niveluri de dificultate; și ' aș dori să adaug propriul meu răspuns după ce le-am oferit altora șansa de a răspunde, care abordează câteva aspecte generale.
  • Bine, @Jeromy. Sunt ' sigur că @ayush nu ar fi furnizat un astfel de comentariu (care ar putea fi ușor interpretat greșit sau mai rău) au fost aceeași întrebare care ar trebui pusă de un utilizator nou. ' să ia acest lucru ca mărturie a înaltei reputații aici și să vedem dacă vreunul dintre răspunsuri vă ajută să vă lumineze corespondentul.
  • @whuber. buna observatie. Fiind consultant de statistică în psihologie, uneori primesc prin e-mail întrebări destul de elementare. Situația mea ideală este să încurajez astfel de studenți să posteze direct aici. În general, prefer să răspund la aceste întrebări pe acest site decât să trimit un răspuns prin e-mail studentului. În acest fel, răspunsul meu poate fi o resursă continuă pentru internet, iar alții pot avea un răspuns și mai bun.

Răspuns

În explicarea semnificației coeficientului de regresie, am găsit că următoarea explicație este foarte utilă. Să presupunem că avem regresia

$$ Y = a + bX $$

Spuneți modificări $ X $ cu $ \ Delta X $ și $ Y $ modificări cu $ \ Delta Y $ . Deoarece avem relația liniară avem

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Din moment ce $ Y = a + bX $ obținem că

$$ \ Delta Y = b \ Delta X. $$

Având acest lucru este ușor de văzut că dacă $ b $ este pozitiv, atunci schimbarea pozitivă în $ X $ va avea ca rezultat schimbare pozitivă în $ Y $. Dacă $ b $ este negativ, atunci schimbarea pozitivă în $ X $ va avea ca rezultat o schimbare negativă în $ Y $.

Notă: Am tratat această întrebare ca fiind una pedagogică, adică oferă explicații simple.

Notă 2: După cum a subliniat @whuber, această explicație are o presupunere importantă că relația este valabilă pentru toate valorile posibile de $ X $ și $ Y $. În realitate, aceasta este o presupunere foarte restrictivă, pe de altă parte, explicația este valabilă pentru valori mici de $ \ Delta X $, deoarece teorema lui Taylor spune că relațiile care pot fi exprimate ca funcții diferențiate (și aceasta este o presupunere rezonabilă de făcut ) sunt liniare la nivel local.

Comentarii

  • … presupunând că comportamentul este cu adevărat liniar în întreaga gamă de valori de $ X $! (Un răspuns mai prudent ar putea susține aceeași idee în ceea ce privește modificările medii și, de asemenea, să evite orice indiciu care să sugereze că relația este cauzală.)
  • @whuber, știam că punerea cuvântul cel mai bun nu a fost o alegere înțeleaptă 🙂 Vă mulțumim pentru comentariu, ' voi încerca să reformulez răspunsul.
  • @mp " Cel mai bun " nu este ' neapărat o problemă. ' Încerc doar să vă fac greu 🙂 (Dar " induc " mi-a atras atenția …) Dacă ' sunteți cu adevărat după " cel mai bun " explicație, reamintim că un punct comun de confuzie printre neinițiați este modul de interpretare a coeficienților de interacțiune: la urma urmei, poți ' t varia în mod independent (să zicem) $ XY $; faceți acest lucru variind fie $ X $ fie $ Y $ sau ambele. Așadar, o explicație care se ocupă de această situație ar fi foarte binevenită.
  • @whuber, da induce a fost o alegere slabă. ' voi lăsa explicația termenilor de interacțiune pentru altcineva 🙂
  • @mp re Notă 2: Ah, Taylor ' Teorema! Dar datele reale nu sunt ' chiar și continue, mult mai puțin diferențiate. Modelul s-ar putea bucura de aceste proprietăți matematice. Mai ales în explicații pentru neinițiați, ar putea fi util să distingem comportamentul modelului ' de comportamentul pe care îl așteptăm de la date.De asemenea, teorema lui Taylor ' spune puțin despre intervalul valorilor $ X $ peste care deține aproape liniaritatea. Modelul de regresie spune că acest interval este infinit!

Răspuns

După cum observă @gung, există diferite convenții cu privire la semnificația ($ \ beta $, adică „beta”). În literatura statistică mai largă, beta este adesea folosit pentru a reprezenta coeficienți nestandardizați. Cu toate acestea, în psihologie (și poate în alte domenii), există adesea o distincție între b pentru coeficienți standardizați și beta pentru coeficienți standardizați. Acest răspuns presupune că contextul indică faptul că beta reprezintă coeficienți standardizați:

  • Ponderile beta: După cum a menționat @whuber, „greutățile beta” sunt, prin convenție, coeficienți de regresie standardizați (vezi wikipedia privind coeficientul standardizat ). În acest context, $ b $ este adesea utilizat pentru coeficienți nestandardizați și $ \ beta $ este adesea folosit pentru coeficienți standardizați.

  • Interpretare de bază : O greutate beta pentru o variabilă predictivă dată este diferența prezisă în variabila rezultată în unități standard pentru o creștere a deviației standard a variabilei predictive date care deține toți ceilalți predictori constantă.

  • Resursă generală asupra regresiei multiple: Întrebarea este elementară și implică faptul că ar trebui să citiți câteva materiale generale despre regresia multiplă ( aici este o descriere elementară de Andy Field ).

  • Cauzalitate: Aveți grijă la limbaj precum „variabila dependentă a crescut ca răspuns la o utilizare mai mare a variabilei independente” . Un astfel de limbaj are conotații cauzale. Ponderile beta de la sine nu sunt suficiente pentru a justifica o interpretare cauzală. Ați avea nevoie de dovezi suplimentare pentru a justifica o interpretare cauzală.

Comentarii

  • +1 Rețineți totuși că există sunt convenții diferite cu privire la utilizarea termenilor în statistici. De exemplu, ' beta ' / $ \ beta $ este adesea folosit pentru a indica parametrul adevărat care guvernează procesul de generare a datelor, & ' beta hat ' / $ \ hat \ beta $ se referă la estimarea pantei calculată în proba ta. În acest caz, acestea nu implică faptul că variabilele au fost standardizate pe primul loc. Această utilizare diferită este regretabilă, dar totuși reală. Este important să fie clar despre modul în care sunt folosiți termenii atunci când cineva îi întâlnește, mai degrabă decât să presupunem că toată lumea înseamnă același lucru.
  • @gung punct bun; Am ' mi-am actualizat răspunsul pentru a include acest lucru.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *