Richtige Gleichung für die Breslow-Day-Statistik im Homogenitätstest des Quotenverhältnisses

In Statistische Methoden der Krebsforschung; Band 1 – Die Analyse von Fall-Kontroll-Studien Die Autoren Breslow und Day leiten eine Statistik ab, um die Homogenität der Kombination von Schichten zu einem Odds Ratio zu testen (Gleichung 4.30). Angesichts des Werts der Statistik bestimmt der Test, ob es angemessen ist, Schichten miteinander zu kombinieren und ein einzelnes Quotenverhältnis zu berechnen.

Wenn wir beispielsweise nur eine 2×2-Kontingenztabelle haben:


(Quelle: kean.edu )

Das Wahrscheinlichkeitsverhältnis für eine Krankheit mit einem Risikofaktor im Vergleich zum Fehlen des Risikofaktors beträgt:

$$ \ psi = (A * D) / (B * C) $$

Wenn wir mehrere Kontingenztabellen haben (z. B. nach Alter schichten) Gruppe) können wir die Mantel-Haenzel-Schätzung verwenden, um das Quotenverhältnis über alle $ I $ -Schichten zu berechnen:

$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$

Für jede Kontingenztabelle haben wir $ R1 = A + B $ , $ R2 = C + D $ und $ C1 = A + C $ , damit wir das erwartete Quotenverhältnis für diese Tabelle in Form der Gesamtsummen ausdrücken können:

$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$

gibt eine quadratische Gleichung für A an. Sei $ a $ die Lösung für diese quadratische Gleichung (nur eine Wurzel gibt eine vernünftige Antwort).

Ein vernünftiger Test für die Angemessenheit der Annahme eines gemeinsamen Quotenverhältnisses besteht daher darin, die quadratische Abweichung zusammenzufassen. von beobachteten und angepassten Werten, die jeweils durch ihre Varianz standardisiert sind:

$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$

wobei die Varianz ist:

$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {- 1} $$

Wenn die Homogenitätsannahme gültig ist und die Stichprobengröße im Verhältnis zur Anzahl der Schichten groß ist, folgt diese Statistik einer ungefähren Chi-Quadrat-Verteilung auf $ I-1 $ Freiheitsgrade und damit ein p-Wert können bestimmt werden.

Wenn wir stattdessen den $ I $ teilen Schichten in $ H $ -Gruppen und wir vermuten, dass die Quotenverhältnisse innerhalb der Gruppen homogen sind, aber nicht zwischen ihnen. Breslow und Day geben eine alternative Statistik an (Gleichung 4.32). :

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ sum _i V_i} $$

wobei die $ i $ -Summierungen über Schichten im $ h ^ {th} $ Gruppe, wobei die Statistik Chi-Quadrat mit nur $ H-1 $ Freiheitsgraden ist (ich nehme einen anderen Mantel an -Haenzel Schätzung wird innerhalb jeder Gruppe berechnet).

Meine Frage ist Gleichung 4.32 scheint mir nicht richtig. Wenn überhaupt, würde ich erwarten, dass es die Form hat:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$

oder:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$

wobei die letztere Gleichung eine Chi-Quadrat-Verteilung auf $ I-1 $ Freiheitsgraden approximiert.

Welche von Soll ich diese Gleichungen verwenden?

Antwort

Dies wird durch die Verwendung einer binären logistischen Regression direkter und genauer behandelt Modell mit einem Interaktionsterm. Der normalerweise beste Test ist der Likelihood-Ratio-Test $ \ chi ^ 2 $ aus einem solchen Modell. Der Regressionskontext ermöglicht es auch, kontinuierliche Variablen zu testen, andere Variablen anzupassen und eine Vielzahl anderer Erweiterungen.

Allgemeiner Kommentar: Ich denke, wir verbringen zu viel Zeit mit dem Unterrichten von Sonderfällen und sollten allgemeine Tools verwenden, damit wir sie haben Sie haben mehr Zeit, um sich mit Komplikationen wie fehlenden Daten, hoher Dimensionalität usw. zu befassen.

Antwort

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.