Quelle est la différence entre les scores Z et les valeurs p?

Dans les algorithmes de motif de réseau, il semble assez courant de renvoyer à la fois une valeur p et un score Z pour une statistique: « Le réseau dentrée contient X copies du sous-graphe G ». Un sous-graphe est considéré comme un motif sil satisfait

  • p-value < A,
  • Z-score> B et
  • X> C, pour certains A, B et C définis par lutilisateur (ou définis par la communauté)

Ceci motive la question:

Question : Quelles sont les différences entre la valeur p et le score Z ?

Et la sous-question:

Question : Y a-t-il des situations où la valeur p et le score Z dune même statistique pourraient suggérer des hypothèses opposées? Les première et deuxième conditions énumérées ci-dessus sont-elles essentiellement les mêmes?

Réponse

Je dirais, sur la base de votre question, quil ny a pas de différence entre les trois tests. Cest dans le sens que vous pouvez toujours choisir A, B et C de telle sorte que la même décision soit prise quel que soit le critère que vous utilisez. Bien que vous ayez besoin que la valeur p soit basée sur la même statistique (cest-à-dire le score Z)

Pour utiliser le score Z, la moyenne $ \ mu $ et la variance $ \ sigma ^ 2 $ sont supposés connus et la distribution est supposée normale (ou asymptotiquement / approximativement normale). Supposons que le critère de valeur p soit le 5% habituel. Ensuite, nous avons:

$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1,645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1,645 \ rightarrow X > \ mu + 1,645 \ sigma $$

Nous avons donc le triple $ (0,05, 1,645, \ mu + 1,645 \ sigma) $ qui représentent tous les mêmes seuils.

Notez que la même correspondance sappliquera au test t, bien que les nombres soient différents. Le test des deux queues aura également une correspondance similaire, mais avec des nombres différents.

Commentaires

  • Merci pour cela! (et merci aux autres répondants aussi).

Réponse

Un score de $ Z $ décrit votre écart de la moyenne en unités décart type. Il nest pas explicite de savoir si vous acceptez ou rejetez votre hypothèse nulle.

Une valeur de $ p $ est la probabilité que sous lhypothèse nulle, nous puissions observer un point aussi extrême que votre statistique. Cela vous indique explicitement si vous rejetez ou acceptez votre hypothèse nulle étant donné une taille de test $ \ alpha $.

Prenons un exemple où $ X \ sim \ mathcal {N} (\ mu, 1) $ et le lhypothèse nulle est $ \ mu = 0 $. Ensuite, vous observez $ x_1 = 5 $. Votre $ Z $ -score est 5 (qui vous indique seulement dans quelle mesure vous vous écartez de votre hypothèse nulle en termes de $ \ sigma $) et votre $ p $ -value est 5.733e-7. Pour une confiance de 95%, vous aurez une taille de test $ \ alpha = 0,05 $ et puisque $ p < \ alpha $ alors vous rejetez lhypothèse nulle. Mais pour toute statistique donnée, il devrait y avoir des équivalents $ A $ et $ B $ tels que les tests soient les mêmes.

Commentaires

  • @ Gary – une valeur de p ne ' ne vous dit pas de rejeter ou pas plus quun score Z. Ce ne sont que des chiffres. Seule la règle de décision détermine lacceptation ou le rejet. Cette règle de décision pourrait également être définie en termes de score Z (par exemple, la règle $ 2 \ sigma $ ou $ 3 \ sigma $)
  • @probabilityislogic Je suis daccord avec vous. En effet, vous pouvez construire un test basé sur le seuil de score $ Z $ mais cela ne vous permet pas de définir explicitement une taille de test au sens classique (cest-à-dire en termes de probabilité). Ce type de critères peut poser problème si votre distribution a des queues épaisses. Lorsque vous construisez un test, vous définissez explicitement une taille de test et donc la valeur $ p $ vous indique immédiatement si vous acceptez ou rejetez, ce que jessayais de faire valoir.
  • @gary – non vraiment, car la valeur p ne fait aucune référence à des alternatives. Il peut donc ' être utilisé pour comparer directement des alternatives. Par exemple, prenez $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. La valeur p de $ H_0 $ reste la même $ 5 \ times 10 ^ {- 7} $. Donc, vous dites " rejeter la valeur nulle " ce qui signifie " accepter lalternative " et déclarez $ \ mu = -1 $. Mais cest absurde, personne ne le ferait, mais la règle de valeur p que vous utilisez ici le fait.En dautres termes, la règle de valeur p que vous avez décrite nest pas invariante par rapport à ce que lon appelle lhypothèse nulle " " (résolution à venir )
  • (cont ' d) La résolution de labsurdité apparente est de noter que la valeur p nest pas un " test absolu ", mais relatif, défini avec une hypothèse alternative implicite. Dans ce cas, lalternative implicite est $ H_ {imp}: \ mu = 5 $. Vous pouvez voir cela en notant que si je calcule la valeur p de $ H_A $, jobtiens $ 1 \ fois 10 ^ {- 9} $, ce qui est plus petit que la valeur p pour $ H_0 $. Maintenant, dans cet exemple, l " alternative implicite " est facile à trouver par intuition, mais elle est beaucoup plus difficile à trouver dans des problèmes plus complexes , où les paramètres de nuisance ou pas de statistiques suffisantes.
  • @Gary – la valeur p nest plus rigoureuse simplement parce que cest une probabilité. Il sagit dune transformation monotone 1 à 1 du score Z. toute " rigueur " qui est possédée par la valeur p est également possédée par le score Z. Bien que si vous utilisez un test bilatéral, léquivalent est la valeur absolue du score Z. Et pour comparer $ H_1: \ mu \ neq 0 $ au null, vous devez adopter une approche " minimax ": qui consiste à choisir lhypothèse précise qui est la plus soutenue par les données et cohérente avec $ H_1 $. À moins que vous ne puissiez montrer comment calculer $ P (X | \ mu \ neq 1) $

Answer

$ p $ -value indique à quel point la statistique est improbable. $ z $ -score indique la distance par rapport à la moyenne. Il peut y avoir une différence entre eux, selon la taille de léchantillon.

Pour les grands échantillons, même de petits écarts par rapport à la moyenne deviennent improbables. Cest à dire. la valeur $ p $ peut être très petite même pour un faible score $ z $. Inversement, pour de petits échantillons, même de grands écarts ne sont pas improbables. Cest à dire. un grand score $ z $ ne signifie pas nécessairement une petite valeur $ p $.

Commentaires

  • si la taille de léchantillon est grande, alors lécart type sera petit, donc le score Z sera élevé. Je pense que vous découvrirez peut-être ceci si vous avez essayé un exemple numérique.
  • Pas vraiment. Supposons que vous échantillonniez à partir de N (0, 1). Ensuite, votre std sera denviron 1 quelle que soit la taille de léchantillon. Ce qui deviendra plus petit, cest lerreur standard de la moyenne, et non lécart type. Les valeurs p sont basées sur SEM, pas sur std.
  • Le score Z est (moyenne observée) / (écart type). Mais la moyenne et lécart type sont de la statistique observée, et non de la population dont les composantes ont été tirées. Ma terminologie lâche a été prise ici. Cependant, si vous testez la moyenne, alors lécart type approprié du score Z est lerreur standard, qui diminue au même rythme que la valeur p.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *