Hvad er forskellen mellem Z-scores og p-værdier?

I netværksmotivalgoritmer synes det ret almindeligt at returnere både en p-værdi og en Z-score til en statistik: “Input-netværk indeholder X kopier af undergraf G”. Et underbillede betragtes som et motiv, hvis det tilfredsstiller

  • p-værdi < A,
  • Z-score> B og
  • X> C, for nogle brugerdefinerede (eller community-definerede) A, B og C.

Dette motiverer spørgsmålet:

Spørgsmål : Hvad er forskellene mellem p-værdi og Z-score ?

Og underspørgsmålet:

Spørgsmål : Er der situationer, hvor p-værdien og Z-score for den samme statistik kan antyde modsatte hypoteser? Er de første og anden betingelser, der er anført ovenfor, stort set de samme?

Svar

Jeg vil på baggrund af dit spørgsmål sige, at der ikke er nogen forskel mellem de tre tests. Dette er i den forstand, at du altid kan vælge A, B og C, således at den samme beslutning nås uanset hvilket kriterium du bruger. Selvom du skal have p-værdien baseret på den samme statistik (dvs. Z-score)

For at bruge Z-score, både den gennemsnitlige $ \ mu $ og varians $ \ sigma ^ 2 $ antages at være kendt, og fordelingen antages normal (eller asymptotisk / tilnærmelsesvis normal). Antag, at p-værdikriteriet er de sædvanlige 5%. Så har vi:

$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Så vi har tredobbelt $ (0,05, 1,645, \ mu + 1,645 \ sigma) $, som alle repræsenterer de samme cut-offs.

Bemærk, at den samme korrespondance gælder for t-testen, selvom tallene vil være forskellige. Testen med to haler vil også have en lignende korrespondance, men med forskellige tal.

Kommentarer

  • Tak for det! (og tak til de andre svarere også).

Svar

En $ Z $ -score beskriver din afvigelse fra middelværdien i enheder med standardafvigelse. Det er ikke eksplicit, om du accepterer eller afviser din nulhypotese.

En $ p $ -værdi er sandsynligheden for, at vi under nulhypotesen kunne observere et punkt, der er lige så ekstremt som din statistik. Dette fortæller dig eksplicit, om du afviser eller accepterer din nulhypotese givet en teststørrelse $ \ alpha $.

Overvej et eksempel, hvor $ X \ sim \ mathcal {N} (\ mu, 1) $ og nullhypotese er $ \ mu = 0 $. Så observerer du $ x_1 = 5 $. Din $ Z $ -score er 5 (som kun fortæller dig, hvor langt du afviger fra din nulhypotese med hensyn til $ \ sigma $), og din $ p $ -værdi er 5.733e-7. For 95% tillid har du en teststørrelse $ \ alpha = 0,05 $, og da $ p < \ alpha $, afviser du nulhypotesen. Men for en given statistik skal der være nogle tilsvarende $ A $ og $ B $, således at testene er de samme.

Kommentarer

  • @ Gary – en p-værdi fortæller dig ikke ' at afvise eller ikke mere end en Z-score. De er bare tal. Det er kun beslutningsreglen, der bestemmer accept eller afvisning. Denne beslutningsregel kunne lige så godt defineres i form af en Z-score (f.eks. $ 2 \ sigma $ eller $ 3 \ sigma $ -reglen)
  • @probabilityislogic Jeg er enig med dig. Faktisk kunne du konstruere en test baseret på $ Z $ score tærskel, men det tillader dig ikke eksplicit at definere en teststørrelse i klassisk forstand (dvs. med hensyn til sandsynlighed). Denne slags kriterier kan være nogle problemer, hvis din distribution har tykke haler. Når du konstruerer en test, definerer du eksplicit en teststørrelse, og $ p $ -værdien fortæller dig straks, om du accepterer eller afviser, hvilket er det punkt, jeg forsøgte at gøre.
  • @gary – ikke virkelig, for p-værdien refererer ikke til alternativer. Så det kan ' ikke bruges til direkte sammenligning af alternativer. Tag f.eks. $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. P-værdien for $ H_0 $ forbliver den samme $ 5 \ gange 10 ^ {- 7} $. Så du siger " afvis nullet " hvilket betyder " accepter alternativet " og erklære $ \ mu = -1 $. Men dette er absurd, ingen ville gøre dette, men den p-værdiregel, du bruger her, gør dette.Sagt på en anden måde, den p-værdiregel, du beskrev, er ikke uændret i forhold til det, der kaldes " nullhypotese " (opløsning kommer )
  • (forts. ' d) Opløsningen af den tilsyneladende absurditet er at bemærke, at p-værdien ikke er en " absolut " test, men en relativ, defineret med en implicit alternativ hypotese. I dette tilfælde er det implicitte alternativ $ H_ {imp}: \ mu = 5 $. Du kan se dette ved at bemærke, at hvis jeg beregner p-værdien på $ H_A $, får jeg $ 1 \ gange 10 ^ {- 9} $, hvilket er mindre end p-værdien for $ H_0 $. Nu i dette eksempel er " implicit alternativ " let at finde ved intuition, men det er meget sværere at finde i mere komplekse problemer , hvor gener af parametre eller ingen tilstrækkelig statistik.
  • @Gary – p-værdien er ikke mere streng, bare fordi det er en sandsynlighed. Det er en monoton 1 til 1 transformation af Z-score. enhver " strenghed ", der er besat af p-værdien, besættes også af Z-score. Selvom du bruger en tosidet test, er ækvivalenten den absolutte værdi af Z-score. Og for at sammenligne $ H_1: \ mu \ neq 0 $ med nullen, skal du tage en " minimax " tilgang: hvilket er at vælge den skarpe hypotese, der understøttes mest af dataene og er i overensstemmelse med $ H_1 $. Medmindre du kan demonstrere, hvordan du beregner $ P (X | \ mu \ neq 1) $

Svar

$ p $ -værdi angiver, hvor usandsynlig statistikken er. $ z $ -score angiver, hvor langt væk fra middelværdien det er. Der kan være en forskel mellem dem afhængigt af stikprøvestørrelsen.

For store prøver bliver selv små afvigelser fra gennemsnittet usandsynlige. Dvs. $ p $ -værdien kan være meget lille, selv for en lav $ z $ -score. Omvendt er selv store afvigelser ikke usandsynlige for små prøver. Dvs. en stor $ z $ -score betyder ikke nødvendigvis en lille $ p $ -værdi.

Kommentarer

  • hvis stikprøvestørrelsen er stor, så standardafvigelsen vil være lille, hvorfor Z-score vil være høj. Jeg tror, du måske opdager dette, hvis du prøvede et numerisk eksempel.
  • Ikke rigtig. Antag at du prøver fra N (0, 1). Derefter vil din std være ca. 1 uanset prøvestørrelse. Hvad der bliver mindre, er standardfejlen for middelværdien, ikke standardafvigelsen. p-værdier er baseret på SEM, ikke på std.
  • Z-score er (observeret-middel) / (standardafvigelse). Men middelværdien og standardafvigelsen er af den observerede statistik, ikke af befolkningen, hvorfra komponenter af den blev trukket. Min slap terminologi er fanget her. Men hvis du tester gennemsnittet, er den passende standardafvigelse i Z-score standardfejlen, som bliver mindre med samme hastighed som p-værdien.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *