In Statistické metody výzkumu rakoviny; Svazek 1 – Analýza studií případové kontroly autoři Breslow a Day odvodili statistiku pro testování homogenity kombinování vrstev do koeficientu pravděpodobnosti (rovnice 4.30). Vzhledem k hodnotě statistiky test určí, zda je vhodné kombinovat vrstvy dohromady a vypočítat jediný poměr šancí.
Například pokud máme pouze jednu kontingenční tabulku 2×2:
(zdroj: kean.edu )
poměr šancí na onemocnění s rizikovým faktorem ve srovnání s tím, že rizikový faktor nemáte, je:
pokud máme více kontingenčních tabulek (například stratifikujeme podle věku skupiny), můžeme použít Mantel-Haenzelův odhad k výpočtu poměru šancí ve všech $ I $ vrstvách:
$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$
Pro každou pohotovostní tabulku máme $ R1 = A + B $ , $ R2 = C + D $ a $ C1 = A + C $ , abychom mohli vyjádřit očekávaný poměr šancí pro tuto tabulku z hlediska součtů:
$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$
který dává kvadratickou rovnici pro A. Nechť $ a $ je řešením této kvadratické rovnice (rozumnou odpověď dává pouze jeden kořen).
Tudíž rozumným testem přiměřenosti předpokladu společného poměru šancí je shrnout druhou mocninu odchylky; ze sledovaných a přizpůsobených hodnot, každá standardizovaná podle své odchylky:
$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$
kde je odchylka:
$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {- 1} $$
Pokud je předpoklad homogenity platný a velikost vzorku je velká vzhledem k počtu vrstev, sleduje tato statistika přibližné rozdělení chí-kvadrát na $ I-1 $ stupně volnosti a lze tak určit hodnotu p.
Pokud místo toho rozdělíme $ I $ vrstvy do $ H $ skupin a máme podezření, že poměr šancí je v rámci skupin homogenní, ale ne mezi nimi, Breslow a Day dávají alternativní statistiku (rovnice 4.32) :
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ součet _i V_i} $$
, kde součty $ i $ jsou nad vrstvami v $ h ^ {th} $ skupina se statistikou bytí chí-kvadrát s pouze $ H-1 $ stupni volnosti (předpokládám jiný Mantel -Haenzelův odhad je počítán v rámci každé skupiny).
Moje otázka je rovnice 4.32 se mi nezdá správná. Pokud vůbec, očekávám, že bude ve tvaru:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$
nebo:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$
s druhou rovnicí přibližující distribuci chí-kvadrátu na $ I-1 $ stupňů volnosti.
Který z tyto rovnice bych měl používat?
Odpověď
Toto se řeší příměji a přesněji pomocí binární logistické regrese model s termínem interakce. Obvykle nejlepším testem je poměr pravděpodobnosti $ \ chi ^ 2 $ test z takového modelu. Regresní kontext také umožňuje testovat spojité proměnné, upravit je pro jiné proměnné a řadu dalších rozšíření.
Obecný komentář: Myslím, že věnujeme příliš mnoho času výuce zvláštních případů a bylo by dobré použít obecné nástroje, abychom e více času na řešení komplikací, jako jsou chybějící data, vysoká dimenze atd.