Z- 점수와 p- 값의 차이점은 무엇입니까?

네트워크 모티프 알고리즘에서는 p- 값 을 모두 반환하는 것이 일반적으로 보입니다. 통계에 대한 Z- 점수 : “입력 네트워크에 하위 그래프 G의 X 복사본이 포함됨”. 하위 그래프는

  • p-value < A,
  • Z-score> B 및 <를 충족하는 경우 모티프로 간주됩니다. / li>
  • X> C, 일부 사용자 정의 (또는 커뮤니티 정의) A, B 및 C.

이 질문에 동기를 부여합니다.

질문 : p- 값과 Z- 점수의 차이점은 무엇입니까? ?

및 하위 질문 :

질문 : 동일한 통계의 p- 값과 Z- 점수가 반대 가설을 제시 할 수있는 상황이 있습니까? 위에 나열된 첫 번째 및 두 번째 조건이 본질적으로 동일합니까?

답변

당신의 질문에 따라 세 가지 테스트간에 차이가 없다고 말하고 싶습니다. 이것은 어떤 기준을 사용하든 동일한 결정이 내려 지도록 항상 A, B, C를 선택할 수 있다는 의미입니다. p- 값이 동일한 통계 (즉, Z- 점수)를 기반으로해야하지만

Z- 점수를 사용하려면 평균 $ \ mu $ 및 분산 $ \ sigma ^ 2 $는 알려진 것으로 가정하고 분포는 정규 (또는 점근 / 근사 정규)로 가정합니다. p- 값 기준이 일반적인 5 %라고 가정합니다. 그런 다음

$$ p = Pr (Z > z) < 0.05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

그래서 우리는 모두 동일한 컷오프를 나타내는 트리플 $ (0.05, 1.645, \ mu + 1.645 \ sigma) $가 있습니다.

수는 다르지만 t- 검정에도 동일한 대응이 적용됩니다. 두 꼬리 테스트도 비슷한 통신문을 가지지 만 숫자는 다릅니다.

댓글

  • 감사합니다! (그리고 다른 답변자들에게도 감사합니다).

답변

$ Z $-점수는 편차를 나타냅니다. 표준 편차 단위의 평균에서. 귀무 가설을 수락할지 거부할지 여부는 명확하지 않습니다.

$ p $-값은 귀무 가설에서 통계만큼 극단적 인 지점을 관찰 할 수있는 확률입니다. 이것은 테스트 크기 $ \ alpha $가 주어 졌을 때 귀무 가설을 거부하거나 수락하는지 여부를 명시 적으로 알려줍니다.

$ X \ sim \ mathcal {N} (\ mu, 1) $ 및 귀무 가설은 $ \ mu = 0 $입니다. 그런 다음 $ x_1 = 5 $를 관찰합니다. $ Z $-점수는 5 ($ \ sigma $ 측면에서 귀무 가설에서 얼마나 벗어 났는지 알려줍니다)이고 $ p $-값은 5.733e-7입니다. 95 % 신뢰도의 경우 테스트 크기는 $ \ alpha = 0.05 $이고 $ p < \ alpha $이므로 귀무 가설을 기각합니다. 그러나 주어진 통계에 대해 동일한 $ A $ 및 $ B $가 있어야 테스트가 동일합니다.

코멘트

  • @ Gary-p- 값은 ' 거부하라고 지시하지 않거나 Z- 점수 이상입니다. 숫자 일뿐입니다. 수락 또는 거부를 결정하는 것은 결정 규칙입니다. 이 결정 규칙은 Z- 점수 (예 : $ 2 \ sigma $ 또는 $ 3 \ sigma $ 규칙)로 동일하게 정의 될 수 있습니다.
  • @probabilityislogic 동의합니다. 실제로 $ Z $ 점수 임계 값을 기반으로 일부 테스트를 구성 할 수 있지만 고전적인 의미 (즉, 확률 측면에서)로 테스트 크기를 명시 적으로 정의 할 수는 없습니다. 이러한 종류의 기준은 분포에 두꺼운 꼬리가있는 경우 문제가 될 수 있습니다. 테스트를 구성 할 때 명시 적으로 테스트 크기를 정의하므로 $ p $-값은 수락 또는 거부 여부를 즉시 알려줍니다. 이것이 제가 시도한 요점입니다.
  • @gary-not 실제로 p- 값은 대안을 참조하지 않습니다. 따라서 ' 대안을 직접 비교하는 데 사용할 수 없습니다. 예를 들어, $ H_0 : \ mu = 0 $ 대 $ H_A : \ mu = -1 $를 사용하십시오. $ H_0 $에 대한 p- 값은 $ 5 \ times 10 ^ {-7} $과 동일하게 유지됩니다. 따라서 " null 거부 "라고 말하면 " 대체 승인 " $ \ mu = -1 $를 선언합니다. 그러나 이것은 어리석은 일입니다. 아무도 이것을하지 않을 것입니다. 그러나 여기서 사용하는 p- 값 규칙은 이것을합니다.다시 말해, 설명하신 p- 값 규칙은 " null 가설 " (해결 방법 제공)과 관련하여 변하지 않습니다. )
  • (cont ' d) 명백한 부조리의 해결책은 p- 값이 " absolute " 테스트이지만 암시 적 대체 가설로 정의 된 상대 테스트입니다. 이 경우 암시 적 대안은 $ H_ {imp} : \ mu = 5 $입니다. $ H_A $의 p- 값을 계산하면 $ H_0 $의 p- 값보다 작은 $ 1 \ times 10 ^ {-9} $를 얻습니다. 이제이 예에서 " 암시 적 대안 "은 직관적으로 찾기 쉽지만 더 복잡한 문제에서는 찾기가 훨씬 더 어렵습니다. , 여기서 성가신 매개 변수 또는 충분한 통계가 없습니다.
  • @Gary-p- 값은 확률 때문에 더 이상 엄격하지 않습니다. Z 점수의 단조로운 일대일 변환입니다. p- 값이 소유 한 모든 " rigor "도 Z- 점수에 포함됩니다. 양면 테스트를 사용하는 경우 동등한 것은 Z 점수의 절대 값입니다. 그리고 $ H_1 : \ mu \ neq 0 $을 null과 비교하려면 " minimax " 접근 방식을 취해야합니다. 데이터에 의해 가장 뒷받침되고 $ H_1 $와 일치하는 예리한 가설을 선택하는 것입니다. $ P (X | \ mu \ neq 1) $

Answer

계산 방법을 보여줄 수없는 경우 $ p $ -value는 통계가 얼마나 가능성이 낮은지를 나타냅니다. $ z $ -score는 평균에서 얼마나 멀리 떨어져 있는지를 나타냅니다. 샘플 크기에 따라 차이가있을 수 있습니다.

큰 표본의 경우 평균에서 작은 편차도 발생하지 않습니다. 즉 $ p $-값은 $ z $-점수가 낮더라도 매우 작을 수 있습니다. 반대로, 작은 샘플의 경우 큰 편차도있을 가능성이 없습니다. 즉 $ z $ -score가 크다고 반드시 $ p $-값이 작다는 것을 의미하지는 않습니다.

댓글

  • 샘플 크기가 크면 표준 편차가 작으므로 Z 점수가 높습니다. 수치적인 예를 들어 보면 알 수있을 것 같습니다.
  • 정말 아닙니다. N (0, 1)에서 샘플링한다고 가정합니다. 그러면 샘플 크기에 관계없이 표준이 약 1이됩니다. 더 작아 질 것은 표준 편차가 아니라 평균의 표준 오차입니다. p- 값은 표준이 아닌 SEM을 기반으로합니다.
  • Z- 점수는 (관찰 평균) / (표준 편차)입니다. 그러나 평균과 표준 편차는 그 성분을 추출한 모집단이 아니라 관측 된 통계량에 대한 것입니다. 내 여유 용어가 여기에 잡혔습니다. 그러나 평균을 테스트하는 경우 Z- 점수의 적절한 표준 편차는 표준 오차이며 p- 값과 같은 비율로 작아집니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다