Mi a ' különbség a binomiális regresszió és a logisztikai regresszió között?

Mindig úgy gondoltam, hogy a logisztikai regresszió egyszerűen a binomiális regresszió speciális esete, ahol a linkfüggvény a logisztikai függvény (mondjuk probit helyett) függvény).

Ha elolvastam a válaszokat egy másik kérdésre , akkor is, úgy tűnik, hogy összezavarodtam, és van egy különbség a logisztikai regresszió és a binomiális regresszió között logisztikai linkkel.

Mi a különbség?

Válasz

A logisztikai regresszió binomiális regresszió a “logisztikai” link funkcióval:

$$ g (p) = \ log \ left (\ frac {p} {1-p} \ right) = X \ beta $$

Bár azt is gondolom, hogy a logisztikai regressziót általában binomiális arányokra alkalmazzák, nem pedig binomiális számokra.

Megjegyzések

  • Mit értesz azon, hogy a logisztikai regressziót általában arányokra alkalmazzák, nem pedig a számlálásokra? Tegyük fel, hogy ' megpróbálom megjósolni, hogy az emberek részt vesznek-e egy buliban, vagy sem, és hogy egy adott partinál tudom, hogy 9 ember vett részt és 1 nem – érted ezt A logisztikai regresszió ezt egy képzési példának tekinti (azaz ennek a pártnak a sikere 0,9 volt), míg a linkkel rendelkező binomiális regresszió ezt 10 képzési példának (9 siker, 1 kudarc) venné?
  • @ raehtin – mindkét esetben $ 1 $ minta / képzési eset lenne, $ (n_i, f_i) = (10,0,9) $ és $ (n_i, x_i) = (10,9) $ értékekkel. A különbség az átlag és a variancia függvények formája. A binomiális érték jelentése $ \ mu_i = n_ip_i $, a kanonciai link most $ \ log \ left (\ frac {\ mu_i} {n_i- \ mu_i} \ right) $ (más néven: " természetes paraméter "), és a varianciafüggvény $ V (\ mu_i) = \ frac {\ mu_i (n_i- \ mu_i)} {n_i} $ diszperziós paraméter $ \ phi_i = 1 $. A logisztikához a $ \ mu_i = p_i $, a fenti linket, a $ V (\ mu_i) = \ mu_i (1- \ mu_i) $ varianciafüggvényét és a $ \ phi_i = \ frac {1} {n_i diszperziót értjük. } $.
  • A logisztikával az $ n_i $ elválasztásra kerül az átlag és a variancia függvényektől, így súlyozással könnyebben figyelembe vehető
  • Ah, értem, I gondolom látom. Ez azt jelenti, hogy egyenértékű eredményeket produkálnak (egyszerűen más módon érkeztek)?
  • @raegtin – azt hiszem. A GLM súlyai, $ w_ {i} ^ {2} = \ frac {1} {\ phi_i V (\ mu_i) [g ' (\ mu_i)] ^ {2} } $, mindkét esetben megegyeznek, és a link függvény ugyanazt a logit értéket adja. Tehát amíg az X változók is megegyeznek, addig ugyanazokat az eredményeket kell adnia.

Válasz

A binomiális regresszió bármilyen típusú bináris átlag-variancia viszonyt használó GLM, ahol a varianciát a $ \ mbox {var} (Y) = \ hat {Y} (1- \ hat {Y}) $ adja. Logisztikai regresszióban a $ \ hat {Y} = \ mbox {logit} ^ {- 1} (\ mathbf {X} \ hat {\ beta}) = 1 / (1- \ exp {(\ mathbf {X} \ hat {\ beta})}}) $ a “link” függvénynek mondott logit függvénnyel. Mindazonáltal a binomiális regressziós modellek általános osztálya bármilyen típusú linkfunkcióval meghatározható, akár olyan funkciók is, amelyek $ [0,1] $ -on kívül eső tartományt adnak ki. Például a probit regresszió az inverz normális CDF, a relatív kockázati regresszió összekapcsolja a log függvényt, az additív kockázati modellek pedig az identitás link modellt.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük