Mindig úgy gondoltam, hogy a logisztikai regresszió egyszerűen a binomiális regresszió speciális esete, ahol a linkfüggvény a logisztikai függvény (mondjuk probit helyett) függvény).
Ha elolvastam a válaszokat egy másik kérdésre , akkor is, úgy tűnik, hogy összezavarodtam, és van egy különbség a logisztikai regresszió és a binomiális regresszió között logisztikai linkkel.
Mi a különbség?
Válasz
A logisztikai regresszió binomiális regresszió a “logisztikai” link funkcióval:
$$ g (p) = \ log \ left (\ frac {p} {1-p} \ right) = X \ beta $$
Bár azt is gondolom, hogy a logisztikai regressziót általában binomiális arányokra alkalmazzák, nem pedig binomiális számokra.
Megjegyzések
- Mit értesz azon, hogy a logisztikai regressziót általában arányokra alkalmazzák, nem pedig a számlálásokra? Tegyük fel, hogy ' megpróbálom megjósolni, hogy az emberek részt vesznek-e egy buliban, vagy sem, és hogy egy adott partinál tudom, hogy 9 ember vett részt és 1 nem – érted ezt A logisztikai regresszió ezt egy képzési példának tekinti (azaz ennek a pártnak a sikere 0,9 volt), míg a linkkel rendelkező binomiális regresszió ezt 10 képzési példának (9 siker, 1 kudarc) venné?
- @ raehtin – mindkét esetben $ 1 $ minta / képzési eset lenne, $ (n_i, f_i) = (10,0,9) $ és $ (n_i, x_i) = (10,9) $ értékekkel. A különbség az átlag és a variancia függvények formája. A binomiális érték jelentése $ \ mu_i = n_ip_i $, a kanonciai link most $ \ log \ left (\ frac {\ mu_i} {n_i- \ mu_i} \ right) $ (más néven: " természetes paraméter "), és a varianciafüggvény $ V (\ mu_i) = \ frac {\ mu_i (n_i- \ mu_i)} {n_i} $ diszperziós paraméter $ \ phi_i = 1 $. A logisztikához a $ \ mu_i = p_i $, a fenti linket, a $ V (\ mu_i) = \ mu_i (1- \ mu_i) $ varianciafüggvényét és a $ \ phi_i = \ frac {1} {n_i diszperziót értjük. } $.
- A logisztikával az $ n_i $ elválasztásra kerül az átlag és a variancia függvényektől, így súlyozással könnyebben figyelembe vehető
- Ah, értem, I gondolom látom. Ez azt jelenti, hogy egyenértékű eredményeket produkálnak (egyszerűen más módon érkeztek)?
- @raegtin – azt hiszem. A GLM súlyai, $ w_ {i} ^ {2} = \ frac {1} {\ phi_i V (\ mu_i) [g ' (\ mu_i)] ^ {2} } $, mindkét esetben megegyeznek, és a link függvény ugyanazt a logit értéket adja. Tehát amíg az X változók is megegyeznek, addig ugyanazokat az eredményeket kell adnia.
Válasz
A binomiális regresszió bármilyen típusú bináris átlag-variancia viszonyt használó GLM, ahol a varianciát a $ \ mbox {var} (Y) = \ hat {Y} (1- \ hat {Y}) $ adja. Logisztikai regresszióban a $ \ hat {Y} = \ mbox {logit} ^ {- 1} (\ mathbf {X} \ hat {\ beta}) = 1 / (1- \ exp {(\ mathbf {X} \ hat {\ beta})}}) $ a “link” függvénynek mondott logit függvénnyel. Mindazonáltal a binomiális regressziós modellek általános osztálya bármilyen típusú linkfunkcióval meghatározható, akár olyan funkciók is, amelyek $ [0,1] $ -on kívül eső tartományt adnak ki. Például a probit regresszió az inverz normális CDF, a relatív kockázati regresszió összekapcsolja a log függvényt, az additív kockázati modellek pedig az identitás link modellt.