Jaký je ' rozdíl mezi binomickou regresí a logistickou regresí?

Vždy jsem logickou regresi považoval za speciální případ binomické regrese, kde logickou funkcí je linková funkce (namísto řekněme probit funkce).

Po přečtení odpovědí na jinou otázku jsem měl, ale zní to, jako bych mohl být zmatený, a existuje rozdíl mezi logistickou regresí a binomickou regresí s logistickým odkazem.

Jaký je rozdíl?

Odpověď

Logistická regrese je binomická regrese s funkcí „logistického“ odkazu:

$$ g (p) = \ log \ left (\ frac {p} {1-p} \ right) = X \ beta $$

I když si také myslím, že logistická regrese se obvykle použije spíše na binomické proporce než na binomické počty.

Komentáře

  • Co myslíte tím, že logistická regrese se obvykle použije spíše na proporce než na počty? Předpokládejme, že se ' snažím předpovědět, zda se lidé zúčastní večírku či nikoli, a že pro konkrétní večírek vím, že se ho zúčastnilo 9 lidí a 1 ne – myslíte to logistická regrese to bere jako jeden příklad školení (tj. tato strana měla úspěšnost 0,9), zatímco binomická regrese s odkazem by to brala jako 10 příkladů školení (9 úspěchů, 1 neúspěch)?
  • @ raehtin – v obou případech by to byl $ 1 $ vzorek / tréninkový případ s $ (n_i, f_i) = (10,0,9) $ a $ (n_i, x_i) = (10,9) $. Rozdíl je ve formě střední a rozptylové funkce. Pro binomický průměr je $ \ mu_i = n_ip_i $, kanonický odkaz je nyní $ \ log \ left (\ frac {\ mu_i} {n_i- \ mu_i} \ right) $ (také se nazývá " přirozený parametr ") a funkce rozptylu je $ V (\ mu_i) = \ frac {\ mu_i (n_i- \ mu_i)} {n_i} $ s rozptylový parametr $ \ phi_i = 1 $. Pro logistiku máme na mysli $ \ mu_i = p_i $, výše uvedený odkaz, rozptylovou funkci $ V (\ mu_i) = \ mu_i (1- \ mu_i) $ a disperzi rovnou $ \ phi_i = \ frac {1} {n_i } $.
  • S logistikou je $ n_i $ odděleno od funkcí střední a odchylky, takže je lze snáze zohlednit pomocí vážení
  • Ah, rozumím, já myslím chápu. Znamená to, že produkují rovnocenné výsledky (jednoduše k nim došlo jiným způsobem)?
  • @raegtin – myslím, že ano. Váhy GLM, $ w_ {i} ^ {2} = \ frac {1} {\ phi_i V (\ mu_i) [g ' (\ mu_i)] ^ {2} } $, jsou v obou případech stejné a funkce link vytváří stejnou hodnotu logitu. Pokud jsou tedy proměnné X také stejné, mělo by to přinést stejné výsledky.

Odpověď

Binomická regrese je libovolný typ GLM využívající vztah binomické střední odchylky, kde je odchylka dána $ \ mbox {var} (Y) = \ hat {Y} (1- \ hat {Y}) $. V logistické regresi $ \ hat {Y} = \ mbox {logit} ^ {- 1} (\ mathbf {X} \ hat {\ beta}) = 1 / (1- \ exp {(\ mathbf {X} \ hat {\ beta})}) $ s funkcí logit, o které se říká, že je „linkovou“ funkcí. Obecnou třídu binomických regresních modelů však lze definovat s jakýmkoli typem funkce odkazu, dokonce i s funkcemi, jejichž výstup je mimo $ [0,1] $. Například probitová regrese přebírá spojení inverzní normální CDF, relativní regrese rizika bere jako odkaz funkci protokolu a modely aditivního rizika přebírají model odkazu identity.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *