I Statistiske metoder til kræftforskning; Bind 1 – Analysen af case-control undersøgelser forfatterne Breslow og Day udleder en statistik for at teste for homogeniteten ved at kombinere strata i et odds ratio (ligning 4.30). I betragtning af statistikens værdi bestemmer testen, om det er hensigtsmæssigt at kombinere lag sammen og beregne et enkelt oddsforhold.
For eksempel hvis vi kun har en 2×2 beredskabstabel:
(kilde: kean.edu )
oddsforholdet for at få en sygdom med en risikofaktor sammenlignet med ikke at have risikofaktoren er:
$$ \ psi = (A * D) / (B * C) $$
hvis vi har flere beredskabstabeller (for eksempel stratificerer vi efter alder gruppe), kan vi bruge estimatet Mantel-Haenzel til at beregne oddsforholdet på tværs af alle $ I $ strata:
$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$
For hver beredskabstabel har vi $ R1 = A + B $ , $ R2 = C + D $ og $ C1 = A + C $ , så vi kan udtrykke det forventede odds-forhold for denne tabel i form af totalerne:
$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$
som giver en kvadratisk ligning for A. Lad $ a $ være løsningen på denne kvadratiske ligning (kun en rod giver et rimeligt svar).
Således er en rimelig test for tilstrækkeligheden af antagelsen om et fælles oddsforhold at opsummere den kvadratiske afvigelse; af observerede og monterede værdier, hver standardiseret efter dens varians:
$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$
hvor variansen er:
$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ højre) ^ {- 1} $$
Hvis antagelsen om homogenitet er gyldig, og størrelsen på prøven er stor i forhold til antallet af lag, følger denne statistik en tilnærmet chi-kvadratfordeling på $ I-1 $ frihedsgrader og dermed en p-værdi kan bestemmes.
Hvis vi i stedet deler $ I $ strata i $ H $ grupper, og vi formoder, at oddsforholdene er homogene inden for grupper, men ikke mellem dem, Breslow og Day giver en alternativ statistik (ligning 4.32) :
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ sum _i V_i} $$
hvor $ i $ summeringerne er over strata i $ h ^ {th} $ gruppe med statistikken chi-firkant med kun $ H-1 $ frihedsgrader (jeg antager en anden mantel -Haenzel estimat beregnes inden for hver gruppe).
Mit spørgsmål er ligning 4.32 synes ikke rigtigt for mig. Hvis noget, ville jeg forvente, at det havde formen:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$
eller:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$
med sidstnævnte ligning tilnærmende en chi-kvadratfordeling på $ I-1 $ frihedsgrader.
Hvilken af disse ligninger skal jeg bruge?
Svar
Dette håndteres mere direkte og mere præcist ved hjælp af en binær logistisk regression model med et interaktionsudtryk. Den normalt bedste test er sandsynlighedsforholdet $ \ chi ^ 2 $ test fra en sådan model. Regressionskonteksten giver også en mulighed for at teste kontinuerlige variabler, justere til andre variabler og en række andre udvidelser.
Generel kommentar: Jeg synes, vi bruger for meget tid på at undervise i specialsager og ville gøre det godt at bruge generelle værktøjer, så vi har e mere tid til at håndtere komplikationer som manglende data, høj dimensionalitet osv.