승산 비 동질성 테스트에서 Breslow-Day 통계에 대한 올바른 방정식

In 암 연구의 통계적 방법; Volume 1-사례 대조 연구 분석 저자 Breslow와 Day는 계층을 승산 비로 결합하는 동질성을 테스트하기위한 통계를 도출합니다 (방정식 4.30). 통계 값이 주어지면 테스트는 계층을 결합하고 단일 승산 비를 계산하는 것이 적절한 지 결정합니다.

예를 들어 2×2 분할 표가 하나만있는 경우 :


(출처 : kean.edu )

위험 요소가없는 것과 비교하여 위험 요소가있는 질병에 걸릴 확률 비는 다음과 같습니다.

$$ \ psi = (A * D) / (B * C) $$

여러 분할 표가있는 경우 (예 : 연령별로 계층화) 그룹), Mantel-Haenzel 추정치를 사용하여 모든 $ I $ 계층의 승산 비를 계산할 수 있습니다.

$$ \ psi_ {mh} = \ frac {\ sum_ {i = 1} ^ {I} A_i D_i / N_i} {\ sum_ {i = 1} ^ {I} B_i C_i / N_i} $$

각 분할 표에 대해 $ R1 = A + B $ , $가 있습니다. R2 = C + D $ $ C1 = A + C $ 를 사용하여 총계로 해당 테이블의 예상 승산 비를 표현할 수 있습니다.

$$ \ psi_ {mh} = \ frac {AD} {BC} = \ frac {A (R2-C1 + A)} {(R1-A) (C1-A)} $$

A에 대한 2 차 방정식을 제공합니다. $ a $ 를이 2 차 방정식의 해답이라고하겠습니다 (근 하나만 적절한 답을 제공함).

따라서 공통 승산 비 가정의 적절성에 대한 합리적인 테스트는 제곱 편차를 합산하는 것입니다. 각각 분산으로 표준화 된 관측치 및 적합치 :

$$ \ chi ^ 2 = \ sum_ {i = 1} ^ {I} \ frac { (a_i-A_i) ^ {2}} {V_i} $$

여기서 분산은 다음과 같습니다.

$$ V_i = \ left (\ frac {1} {A_i} + \ frac {1} {B_i} + \ frac {1} {C_i} + \ frac {1} {D_i} \ right) ^ {-1} $$

동질성 가정이 유효하고 표본의 크기가 계층 수에 비해 큰 경우이 통계는 $ I-1 $ 자유도이므로 p- 값을 결정할 수 있습니다.

대신 $ I $를 나누면 계층을 $ H $ 그룹으로 나누고 승산 비가 그룹 내에서는 동일하지만 그룹 간에는 같지 않은 것으로 의심됩니다. Breslow와 Day는 대체 통계를 제공합니다 (방정식 4.32). :

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ left (\ sum_i a_i-A_i \ right) ^ {2}} {\ sum _i V_i} $$

여기서 $ i $ 합계는 pan class = “math-container”의 계층 위에 있습니다. 자유도가 $ H-1 $ 뿐인 카이 제곱 통계가있는> $ h ^ {th} $ 그룹 (저는 다른 Mantel -Haenzel 추정치는 각 그룹 내에서 계산됩니다.)

제 질문은 방정식 4.32가 나에게 옳지 않은 것 같습니다. 다음과 같은 형식을 기대합니다.

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ frac {\ sum_i \ left (a_i-A_i \ right) ^ {2}} {\ sum_i V_i} $$

또는 :

$$ \ chi ^ 2 = \ sum_ {h = 1} ^ {H} \ sum_ {i} \ frac {(a_i-A_i) ^ {2}} {V_i} $$

후자의 방정식은 $ I-1 $ 자유도에 대한 카이-제곱 분포에 가깝습니다.

이 방정식을 사용해야합니까?

답변

이진 로지스틱 회귀를 사용하여보다 직접적이고 정확하게 처리됩니다. 상호 작용 항이있는 모델. 일반적으로 가장 좋은 테스트는 그러한 모델의 우도 비 $ \ chi ^ 2 $ 테스트입니다. 회귀 컨텍스트를 사용하면 연속 변수를 테스트하고 다른 변수를 조정하고 다른 확장을 수행 할 수도 있습니다.

일반적인 의견 : 특별한 경우를 가르치는 데 너무 많은 시간을 소비하고 일반 도구를 사용하여 데이터 누락, 높은 차원 성 등과 같은 복잡한 문제를 처리하는 데 더 많은 시간이 소요됩니다.

답변

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다