Was ist der Unterschied zwischen Z-Scores und p-Werten?

In Netzwerkmotivalgorithmen scheint es durchaus üblich zu sein, sowohl einen p-Wert zurückzugeben und ein Z-Score für eine Statistik: „Das Eingabenetzwerk enthält X Kopien des Untergraphen G“. Ein Untergraph gilt als Motiv, wenn er den

  • p-Wert < A,
  • Z-Score> B und
  • X> C für einige benutzerdefinierte (oder Community-definierte) A, B und C.

Dies motiviert die Frage:

Frage : Was sind die Unterschiede zwischen p-Wert und Z-Score? ?

Und die Unterfrage:

Frage : Gibt es Situationen, in denen der p-Wert und der Z-Score derselben Statistik auf entgegengesetzte Hypothesen hindeuten könnten? Sind die oben aufgeführten ersten und zweiten Bedingungen im Wesentlichen gleich?

Antwort

Ich würde aufgrund Ihrer Frage sagen, dass es keinen Unterschied zwischen den drei Tests gibt. Dies bedeutet, dass Sie immer A, B und C auswählen können, sodass unabhängig vom verwendeten Kriterium dieselbe Entscheidung getroffen wird. Obwohl der p-Wert auf derselben Statistik basieren muss (dh auf dem Z-Score)

Um den Z-Score zu verwenden, müssen sowohl der Mittelwert $ \ mu $ als auch die Varianz $ \ sigma ^ 2 verwendet werden Es wird angenommen, dass $ bekannt ist, und die Verteilung wird als normal (oder asymptotisch / ungefähr normal) angenommen. Angenommen, das p-Wert-Kriterium beträgt die üblichen 5%. Dann haben wir:

$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Wir haben also das dreifache $ (0.05, 1.645, \ mu + 1.645 \ sigma) $, die alle die gleichen Grenzwerte darstellen.

Beachten Sie, dass für den t-Test dieselbe Entsprechung gilt, obwohl die Zahlen unterschiedlich sind. Der Zwei-Schwanz-Test hat ebenfalls eine ähnliche Entsprechung, jedoch mit unterschiedlichen Nummern.

Kommentare

  • Danke dafür! (und danke auch an die anderen Antwortenden).

Antwort

Ein $ Z $ -Punkt beschreibt Ihre Abweichung vom Mittelwert in Einheiten der Standardabweichung. Es ist nicht explizit, ob Sie Ihre Nullhypothese akzeptieren oder ablehnen.

Ein $ p $ -Wert ist die Wahrscheinlichkeit, dass wir unter der Nullhypothese einen Punkt beobachten können, der so extrem ist wie Ihre Statistik. Hier erfahren Sie explizit, ob Sie Ihre Nullhypothese bei einer Testgröße von $ \ alpha $ ablehnen oder akzeptieren.

Betrachten Sie ein Beispiel, in dem $ X \ sim \ mathcal {N} (\ mu, 1) $ und das Die Nullhypothese lautet $ \ mu = 0 $. Dann beobachten Sie $ x_1 = 5 $. Ihr $ Z $ -Wert ist 5 (was Ihnen nur sagt, wie weit Sie in Bezug auf $ \ sigma $ von Ihrer Nullhypothese abweichen) und Ihr $ p $ -Wert ist 5.733e-7. Für eine 95% ige Sicherheit haben Sie eine Testgröße $ \ alpha = 0.05 $ und da $ p < \ alpha $, lehnen Sie die Nullhypothese ab. Für eine bestimmte Statistik sollte es jedoch ein Äquivalent von $ A $ und $ B $ geben, sodass die Tests gleich sind.

Kommentare

  • @ Gary – ein p-Wert sagt ' nicht, dass Sie einen Z-Score ablehnen sollen oder nicht. Sie sind nur Zahlen. Nur die Entscheidungsregel bestimmt das Akzeptieren oder Ablehnen. Diese Entscheidungsregel könnte ebenso gut als Z-Score definiert werden (z. B. die $ 2 \ sigma $ – oder $ 3 \ sigma $ -Regel).
  • @probabilityislogic Ich stimme Ihnen zu. In der Tat könnten Sie einen Test basierend auf dem $ Z $ -Score-Schwellenwert erstellen, aber es erlaubt Ihnen nicht, eine Testgröße im klassischen Sinne (d. H. In Bezug auf die Wahrscheinlichkeit) explizit zu definieren. Diese Art von Kriterien kann einige Probleme bereiten, wenn Ihre Distribution dicke Schwänze hat. Wenn Sie einen Test erstellen, definieren Sie explizit eine Testgröße und daher sagt Ihnen der $ p $ -Wert sofort, ob Sie akzeptieren oder ablehnen. Dies ist der Punkt, den ich anstrebte.
  • @gary – nicht wirklich, denn der p-Wert bezieht sich nicht auf Alternativen. Daher kann ' nicht verwendet werden, um Alternativen direkt zu vergleichen. Nehmen Sie zum Beispiel $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. Der p-Wert für $ H_0 $ bleibt gleich $ 5 \ times 10 ^ {- 7} $. Sie sagen also, " lehnt die Null ab " was bedeutet, dass " die alternative " und deklariere $ \ mu = -1 $. Aber das ist absurd, niemand würde das tun, aber die p-Wert-Regel, die Sie hier verwenden, tut dies.Anders ausgedrückt, die von Ihnen beschriebene p-Wert-Regel ist in Bezug auf die sogenannte " Nullhypothese " nicht unveränderlich (Auflösung kommt) )
  • (cont ' d) Die Auflösung der offensichtlichen Absurdität ist zu beachten, dass der p-Wert kein " absoluter " Test, aber ein relativer Test, definiert mit einer impliziten alternativen Hypothese. In diesem Fall lautet die implizite Alternative $ H_ {imp}: \ mu = 5 $. Sie können dies sehen, indem Sie feststellen, dass ich, wenn ich den p-Wert von $ H_A $ berechne, $ 1 \ mal 10 ^ {- 9} $ erhalte, was kleiner als der p-Wert für $ H_0 $ ist. In diesem Beispiel ist die implizite Alternative "

" intuitiv leicht zu finden, bei komplexeren Problemen jedoch viel schwieriger , wo Störparameter oder keine ausreichende Statistik.

  • @Gary – der p-Wert ist nicht strenger, nur weil es sich um eine Wahrscheinlichkeit handelt. Es ist eine monotone 1-zu-1-Transformation des Z-Scores. Jede " Rigor ", die vom p-Wert besessen wird, wird auch vom Z-Score besessen. Wenn Sie einen zweiseitigen Test verwenden, ist das Äquivalent der absolute Wert des Z-Scores. Und um $ H_1: \ mu \ neq 0 $ mit der Null zu vergleichen, müssen Sie einen " minimax " Ansatz wählen: Dies ist die Auswahl der scharfen Hypothese, die am meisten von den Daten unterstützt wird und mit $ H_1 $ übereinstimmt. Es sei denn, Sie können demonstrieren, wie $ P (X | \ mu \ neq 1) berechnet wird.
  • Antwort

    $ p $ -Wert gibt an, wie unwahrscheinlich die Statistik ist. $ z $ -score gibt an, wie weit es vom Mittelwert entfernt ist. Je nach Stichprobengröße kann es einen Unterschied zwischen ihnen geben.

    Bei großen Stichproben sind selbst kleine Abweichungen vom Mittelwert unwahrscheinlich. Das heißt, Der $ p $ -Wert kann selbst bei einem niedrigen $ z $ -Wert sehr klein sein. Umgekehrt sind bei kleinen Stichproben auch große Abweichungen nicht unwahrscheinlich. Das heißt, Ein großer $ z $ -Punkt bedeutet nicht unbedingt einen kleinen $ p $ -Wert.

    Kommentare

    • Wenn die Stichprobengröße groß ist, dann Die Standardabweichung ist klein, daher ist der Z-Score hoch. Ich denke, Sie können dies entdecken, wenn Sie ein numerisches Beispiel ausprobieren.
    • Nicht wirklich. Angenommen, Sie probieren aus N (0, 1). Dann ist Ihr Standard ungefähr 1, unabhängig von der Stichprobengröße. Was kleiner wird, ist der Standardfehler des Mittelwerts, nicht die Standardabweichung. p-Werte basieren auf SEM, nicht auf Standard.
    • Der Z-Score ist (beobachteter Mittelwert) / (Standardabweichung). Der Mittelwert und die Standardabweichung beziehen sich jedoch auf die beobachtete Statistik und nicht auf die Population, aus der Komponenten stammen. Meine lockere Terminologie wurde hier gefangen. Wenn Sie jedoch den Mittelwert testen, ist die entsprechende Standardabweichung im Z-Score der Standardfehler, der mit der gleichen Rate wie der p-Wert kleiner wird.

    Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.