Corriger léquation pour la statistique de Breslow-Day dans le test dhomogénéité du rapport de cotes

In Méthodes statistiques de recherche sur le cancer; Volume 1 – Lanalyse des études cas-témoins les auteurs Breslow et Day dérivent une statistique pour tester lhomogénéité de la combinaison de strates en un odds ratio (équation 4.30). Compte tenu de la valeur de la statistique, le test détermine sil est approprié de combiner des strates et de calculer un seul rapport de cotes.

Par exemple, si nous navons quune seule table de contingence 2×2:


(source: kean.edu )

le rapport de cotes pour attraper une maladie avec un facteur de risque par rapport à ne pas avoir le facteur de risque est:

$$ \ psi = (A * D) / (B * C) $$

si nous avons plusieurs tableaux de contingence (par exemple, nous stratifions par âge group), nous pouvons utiliser lestimation de Mantel-Haenzel pour calculer le rapport de cotes sur toutes les strates $ I $ :

$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$

Pour chaque table de contingence, nous avons $ R1 = A + B $ , $ R2 = C + D $ et $ C1 = A + C $ afin que nous puissions exprimer le rapport de cotes attendu pour cette table en termes de totaux:

$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$

qui donne une équation quadratique pour A. Soit $ a $ la solution de cette équation quadratique (une seule racine donne une réponse raisonnable).

Ainsi, un test raisonnable de ladéquation de lhypothèse dun rapport de cotes commun consiste à faire la somme de lécart au carré; de valeurs observées et ajustées, chacune normalisée par sa variance:

$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$

où la variance est:

$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {- 1} $$

Si lhypothèse dhomogénéité est valide et que la taille de léchantillon est grande par rapport au nombre de strates, cette statistique suit une distribution approximative du chi carré sur $ I-1 $ degrés de liberté et donc une valeur p peuvent être déterminés.

Si à la place nous divisons le $ I $ strates dans des groupes $ H $ et nous suspectons que les rapports de cotes sont homogènes au sein des groupes mais pas entre eux, Breslow et Day donnent une statistique alternative (équation 4.32) :

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ sum _i V_i} $$

où les sommations de $ i $ sont sur les strates du $ h ^ {th} $ groupe avec la statistique étant chi-carré avec seulement $ H-1 $ degrés de liberté (je suppose un Mantel différent -Lestimation de Haenzel est calculée dans chaque groupe).

Ma question est léquation 4.32 ne me semble pas juste. Si quoi que ce soit, je mattends à ce quil soit de la forme:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$

ou:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$

avec cette dernière équation sapprochant dune distribution chi carré sur $ I-1 $ degrés de liberté.

Laquelle de ces équations devrais-je utiliser?

Réponse

Ceci est géré plus directement et plus précisément grâce à lutilisation dune régression logistique binaire modèle avec un terme dinteraction. Le test généralement le meilleur est le test du rapport de vraisemblance $ \ chi ^ 2 $ dun tel modèle. Le contexte de régression permet également de tester des variables continues, dajuster pour dautres variables et une foule dautres extensions.

Commentaire général: je pense que nous passons trop de temps à enseigner des cas particuliers et ferions bien dutiliser des outils généraux pour Nous avons plus de temps pour gérer les complications telles que les données manquantes, la haute dimensionnalité, etc.

Réponse

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *