In Statistische methoden van kankeronderzoek; Deel 1 – De analyse van case-control studies de auteurs Breslow en Day leiden een statistiek af om te testen op de homogeniteit van het combineren van strata tot een odds ratio (vergelijking 4.30). Gezien de waarde van de statistiek, bepaalt de test of het gepast is om strata samen te voegen en een enkele odds ratio te berekenen.
Als we bijvoorbeeld maar één 2×2 kruistabel hebben:
(bron: kean.edu )
de odds ratio voor het krijgen van een ziekte met een risicofactor vergeleken met het niet hebben van de risicofactor is:
$$ \ psi = (A * D) / (B * C) $$
als we meerdere kruistabellen hebben (we stratificeren bijvoorbeeld naar leeftijd group), kunnen we de schatting van Mantel-Haenzel gebruiken om de odds ratio te berekenen voor alle $ I $ strata:
$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$
Voor elke kruistabel hebben we $ R1 = A + B $ , $ R2 = C + D $ en $ C1 = A + C $ zodat we de verwachte odds ratio voor die tabel kunnen uitdrukken in termen van de totalen:
$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$
die een kwadratische vergelijking geeft voor A. Laat $ a $ de oplossing zijn voor deze kwadratische vergelijking (slechts één wortel geeft een redelijk antwoord).
Een redelijke test voor de toereikendheid van de aanname van een gemeenschappelijke odds ratio is dus het optellen van de gekwadrateerde afwijking; van waargenomen en aangepaste waarden, elk gestandaardiseerd op basis van hun variantie:
$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$
waar de variantie is:
$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {- 1} $$
Als de homogeniteitsaanname geldig is en de omvang van de steekproef groot is in verhouding tot het aantal strata, volgt deze statistiek een geschatte chikwadraatverdeling op $ I-1 $ vrijheidsgraden en dus een p-waarde kan worden bepaald.
Als we in plaats daarvan de $ I $ strata in $ H $ groepen en we vermoeden dat de odds ratios homogeen zijn binnen groepen, maar niet tussen hen, Breslow en Day geven een alternatieve statistiek (vergelijking 4.32) :
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ som _i V_i} $$
waar de $ i $ sommaties over strata zijn in de $ h ^ {th} $ groep met als statistiek chi-kwadraat met slechts $ H-1 $ vrijheidsgraden (ik neem aan dat een andere Mantel -Haenzel schatting wordt berekend binnen elke groep).
Mijn vraag is vergelijking 4.32 lijkt mij niet juist. Ik zou in elk geval verwachten dat het de volgende vorm heeft:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$
of:
$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$
waarbij de laatste vergelijking een chikwadraatverdeling benadert op $ I-1 $ vrijheidsgraden.
Welke van deze vergelijkingen moet ik gebruiken?
Antwoord
Dit wordt directer en nauwkeuriger afgehandeld door het gebruik van een binaire logistische regressie model met een interactieterm. De doorgaans beste test is de waarschijnlijkheidsratio $ \ chi ^ 2 $ -test van een dergelijk model. De regressiecontext maakt het ook mogelijk om continue variabelen te testen, aan te passen voor andere variabelen en een groot aantal andere uitbreidingen.
Algemene opmerking: ik denk dat we te veel tijd besteden aan het lesgeven in speciale gevallen en dat we er goed aan doen om algemene hulpmiddelen te gebruiken, zodat we e meer tijd om met complicaties om te gaan, zoals ontbrekende gegevens, hoge dimensionaliteit, enz.