Ecuație corectă pentru statistica Breslow-Day în testul de omogenitate al raportului de cote

În Metode statistice de cercetare a cancerului; Volumul 1 – Analiza studiilor caz-control autorii Breslow și Day obțin o statistică pentru a testa omogenitatea combinării straturilor într-un raport de probabilități (ecuația 4.30). Având în vedere valoarea statisticii, testul determină dacă este adecvat să combinați straturile împreună și să calculați un singur raport de probabilități.

De exemplu, dacă avem un singur tabel de contingență 2×2:


(sursă: kean.edu )

raportul de șanse pentru a obține o boală cu factor de risc comparativ cu faptul că nu are factor de risc este:

$$ \ psi = (A * D) / (B * C) $$

dacă avem mai multe tabele de contingență (de exemplu, ne stratificăm după vârstă grup), putem folosi estimarea Mantel-Haenzel pentru a calcula raportul de probabilitate în toate straturile $ I $ :

$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$

Pentru fiecare tabel de contingență avem $ R1 = A + B $ , $ R2 = C + D $ și $ C1 = A + C $ , astfel încât să putem exprima raportul de șanse așteptat pentru acel tabel în termeni de totaluri:

$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$

care oferă o ecuație pătratică pentru A. Fie $ a $ soluția la această ecuație pătratică (doar o rădăcină oferă un răspuns rezonabil).

Astfel, un test rezonabil pentru adecvarea presupunerii unui raport de cote comun este să rezumăm abaterea pătrată; a valorilor observate și ajustate, fiecare standardizată prin varianța sa:

$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i – A_i) ^ {2}} {V_i} $$

unde este varianța:

$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {- 1} $$

Dacă presupunerea de omogenitate este validă, iar dimensiunea eșantionului este mare în raport cu numărul de straturi, această statistică urmează o distribuție aproximată chi-pătrat pe $ I-1 $ grade de libertate și astfel se poate determina o valoare p.

Dacă în schimb împărțim $ I $ straturi în grupuri $ H $ și suspectăm că ratele de șanse sunt omogene în cadrul grupurilor, dar nu între ele, Breslow și Day oferă o statistică alternativă (ecuația 4.32) :

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i – A_i \ right) ^ {2}} {\ sum _i V_i} $$

unde sumele $ i $ sunt peste straturi în $ h ^ {th} $ grup cu statistica fiind chi-pătrat cu numai $ H-1 $ grade de libertate (presupun că un Mantel diferit -Estimația Haenzel este calculată în cadrul fiecărui grup).

Întrebarea mea este că ecuația 4.32 nu mi se pare corectă. În orice caz, m-aș aștepta să aibă forma:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i – A_i \ right) ^ {2}} {\ sum_i V_i} $$

sau:

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i – A_i) ^ {2}} {V_i} $$

cu ultima ecuație aproximând o distribuție chi-pătrat pe $ I-1 $ grade de libertate.

Care dintre ar trebui să folosesc aceste ecuații?

Răspuns

Acest lucru este tratat mai direct și mai precis prin utilizarea unei regresii logistice binare model cu un termen de interacțiune. Cel mai bun test de obicei este raportul de probabilitate $ \ chi ^ 2 $ test dintr-un astfel de model. Contextul de regresie permite de asemenea testarea variabilelor continue, ajustarea pentru alte variabile și o serie de alte extensii.

Comentariu general: cred că petrecem prea mult timp predând cazuri speciale și ar fi bine să folosim instrumente generale, astfel încât să avem Mai avem timp pentru a face față complicațiilor, cum ar fi date lipsă, dimensionalitate ridicată etc.

Răspuns

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *