M-am gândit întotdeauna la regresia logistică ca la un caz special de regresie binomială în care funcția de legătură este funcția logistică (în loc de, să zicem, un probit funcție).
Din citirea răspunsurilor la o altă întrebare pe care am avut-o, totuși, se pare că aș putea fi confuz și există un diferența dintre regresia logistică și regresia binomială cu o legătură logistică.
Care este diferența?
Răspuns
Regresia logistică este o regresie binomială cu funcția de legătură „logistică”:
$$ g (p) = \ log \ left (\ frac {p} {1-p} \ right) = X \ beta $$
Deși cred că regresia logistică este de obicei aplicată proporțiilor binomiale mai degrabă decât numărărilor binomiale.
Comentarii
- Ce vrei să spui prin regresia logistică care se aplică de obicei la proporții, nu la numărări? Să presupunem că ' încerc să prezic dacă oamenii vor participa sau nu la o petrecere și că, pentru o anumită petrecere, știu că 9 persoane au participat și 1 nu au participat – vrei să spui că regresia logistică ia acest lucru ca un exemplu de antrenament (de exemplu, această parte a avut o rată de succes de 0,9), în timp ce regresia binomială cu o legătură ar lua acest lucru ca 10 exemple de antrenament (9 succese, 1 eșec)?
- @ raehtin – în ambele cazuri ar fi $ 1 $ eșantion / caz de antrenament, cu $ (n_i, f_i) = (10,0.9) $ și respectiv $ (n_i, x_i) = (10,9) $. Diferența este forma funcțiilor de medie și varianță. Pentru binom, media este $ \ mu_i = n_ip_i $, linkul canoncial este acum $ \ log \ left (\ frac {\ mu_i} {n_i- \ mu_i} \ right) $ (numit și " parametru natural "), iar funcția de varianță este $ V (\ mu_i) = \ frac {\ mu_i (n_i- \ mu_i)} {n_i} $ cu parametru de dispersie $ \ phi_i = 1 $. Pentru logistică avem media $ \ mu_i = p_i $, legătura de mai sus, funcția de varianță a $ V (\ mu_i) = \ mu_i (1- \ mu_i) $ și dispersie egală cu $ \ phi_i = \ frac {1} {n_i } $.
- Cu logistica, $ n_i $ este separat de funcțiile de medie și varianță, deci poate fi luat mai ușor în considerare prin ponderare
- Ah, am înțeles, eu cred Văd. Înseamnă asta că produc rezultate echivalente (care au ajuns pur și simplu dintr-un mod diferit)?
- @raegtin – Cred că da. Greutățile GLM, $ w_ {i} ^ {2} = \ frac {1} {\ phi_i V (\ mu_i) [g ' (\ mu_i)] ^ {2} } $, sunt egale în ambele cazuri, iar funcția de legătură produce aceeași valoare logit. Deci, atâta timp cât variabilele X sunt, de asemenea, aceleași, atunci ar trebui să dea aceleași rezultate.
Răspuns
Regresia binomială este orice tip de GLM care utilizează o relație binomială medie-varianță în care varianța este dată de $ \ mbox {var} (Y) = \ hat {Y} (1- \ hat {Y}) $. În regresie logistică $ \ hat {Y} = \ mbox {logit} ^ {- 1} (\ mathbf {X} \ hat {\ beta}) = 1 / (1- \ exp {(\ mathbf {X} \ hat {\ beta})}) $ cu funcția logit despre care se spune că este o funcție „link”. Cu toate acestea, o clasă generală de modele de regresie binomială poate fi definită cu orice tip de funcție de legătură, chiar și funcții oferind un interval în afara $ [0,1] $. De exemplu, regresia probit ia o legătură a CDF invers invers, regresia relativă a riscului ia ca legătură funcția jurnal, iar modelele de risc aditiv iau modelul legăturii de identitate.