Zスコアとp値の違いは何ですか?

ネットワークモチーフアルゴリズムでは、 p値の両方を返すのが非常に一般的です。統計の Zスコア:「入力ネットワークにはサブグラフGのX個のコピーが含まれています」。サブグラフは、

  • p-value < A、
  • Z-score> B、および<を満たす場合にモチーフと見なされます。 / li>
  • X> C、一部のユーザー定義(またはコミュニティ定義)のA、B、Cの場合。

これが質問の動機になります:

質問:p値とZスコアの違いは何ですか?

そしてサブ質問:

質問:同じ統計のp値とZスコアが反対の仮説を示唆する状況はありますか?上記の最初と2番目の条件は基本的に同じですか?

回答

あなたの質問に基づいて、3つのテストの間に違いはないと思います。これは、使用している基準に関係なく同じ決定が下されるように、常にA、B、およびCを選択できるという意味です。 p値が同じ統計(つまりZスコア)に基づいている必要がありますが

Zスコアを使用するには、平均$ \ mu $と分散$ \ sigma ^ 2の両方$は既知であると想定され、分布は正常(または漸近的/ほぼ正常)であると想定されます。 p値の基準が通常の5%であると仮定します。次に、次のようになります。

$$ p = Pr(Z > z)< 0.05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

つまり、トリプル$(0.05、1.645、\ mu + 1.645 \ sigma)$があり、これらはすべて同じカットオフを表します。

数値は異なりますが、同じ対応がt検定に適用されることに注意してください。両側検定も同様の対応を持ちますが、番号が異なります。

コメント

  • ありがとうございます! (そして他の回答者にも感謝します。)

回答

$ Z $スコアはあなたの偏差を表します標準偏差の単位での平均から。ヌル仮説を受け入れるか拒否するかは明確ではありません。

$ p $値は、ヌル仮説の下で、統計と同じくらい極端な点を観測できる確率です。これにより、テストサイズ$ \ alpha $が与えられた場合にnull仮説を棄却するか受け入れるかが明示的に示されます。

$ X \ sim \ mathcal {N}(\ mu、1)$と帰無仮説は$ \ mu = 0 $です。次に、$ x_1 = 5 $を観察します。 $ Z $スコアは5($ \ sigma $に関してnull仮説からどれだけ逸脱しているかを示すだけです)で、$ p $値は5.733e-7です。 95%の信頼度では、テストサイズは$ \ alpha = 0.05 $になり、$ p < \ alpha $なので、帰無仮説を棄却します。ただし、特定の統計については、テストが同じになるように、同等の$ A $と$ B $が必要です。

コメント

  • @ゲイリー-p値は'拒否するか、Zスコア以下にするように指示しません。それらは単なる数字です。受け入れるか拒否するかを決定するのは決定ルールだけです。この決定ルールは、Zスコア(たとえば、$ 2 \ sigma $または$ 3 \ sigma $ルール)の観点からも同様に定義できます。
  • @probabilityislogic私はあなたに同意します。実際、$ Z $スコアのしきい値に基づいてテストを作成することはできますが、古典的な意味で(つまり、確率の観点から)テストサイズを明示的に定義することはできません。ディストリビューションのテールが厚い場合、この種の基準は問題になる可能性があります。テストを作成するときは、テストサイズを明示的に定義するため、$ p $値は、受け入れるか拒否するかをすぐに示します。これが、私が試みたポイントです。
  • @ gary-not実際、p値は代替案を参照していません。そのため、'を使用して代替案を直接比較することはできません。たとえば、$ H_0:\ mu = 0 $と$ H_A:\ mu = -1 $を比較します。 $ H_0 $のp値は同じ$ 5 \ times 10 ^ {-7} $のままです。つまり、"ヌルを拒否する"と言います。これは、"代替案を受け入れることを意味します"そして$ \ mu = -1 $を宣言します。しかし、これはばかげています。誰もこれを行いませんが、ここで使用するp値ルールはこれを行います。言い換えると、あなたが説明したp値の規則は、"ヌル仮説"と呼ばれるものに関して不変ではありません(解決策が来る)
  • (cont ' d)明らかな不条理の解決策は、p値が" abstract "テストですが、暗黙の対立仮説で定義された相対テストです。この場合、暗黙の代替は$ H_ {imp}:\ mu = 5 $です。これは、$ H_A $のp値を計算すると、$ H_0 $のp値よりも小さい$ 1 \ times 10 ^ {-9} $が得られることに注意してください。この例では、"暗黙の代替"は直感的に簡単に見つけることができますが、より複雑な問題では見つけるのがはるかに困難です。 、ここで、妨害パラメータまたは十分統計量がありません。
  • @ Gary-p値は、確率であるという理由だけで、これ以上厳密ではありません。これは、Zスコアの単調な1対1の変換です。 p値が所有する"厳密な"は、Zスコアも所有します。ただし、両側検定を使用している場合、同等のものはZスコアの絶対値です。また、$ H_1:\ mu \ neq 0 $をnullと比較するには、" minimax "アプローチを採用する必要があります。これは、データによって最もサポートされ、$ H_1 $と一致する鋭い仮説を選択することです。 $ P(X | \ mu \ neq 1)$

回答

の計算方法を示すことができない場合$ p $ -valueは、統計がどれほどありそうもないかを示します。 $ z $ -scoreは、平均からどれだけ離れているかを示します。サンプルサイズによっては、違いがある場合があります。

大きなサンプルの場合、平均からのわずかな偏差でさえありそうにありません。つまり$ z $スコアが低くても、$ p $値は非常に小さい場合があります。逆に、小さなサンプルの場合、大きな偏差でさえありそうにありません。つまり$ z $スコアが大きいからといって、必ずしも$ p $値が小さいとは限りません。

コメント

  • サンプルサイズが大きい場合は、標準偏差が小さいため、Zスコアが高くなります。数値例を試してみれば、これを発見できると思います。
  • そうではありません。 N(0、1)からサンプリングするとします。その場合、サンプルサイズに関係なく、標準は約1になります。小さくなるのは、標準偏差ではなく、平均の標準誤差です。 p値は標準ではなくSEMに基づいています。
  • Zスコアは(観測平均)/(標準偏差)です。ただし、平均と標準偏差は観測された統計のものであり、その構成要素が抽出された母集団のものではありません。私のたるんだ用語はここにあります。ただし、平均をテストする場合、Zスコアの適切な標準偏差は標準誤差であり、p値と同じ割合で小さくなります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です