Vad är skillnaden mellan Z-poäng och p-värden?

I nätverksmotivalgoritmer verkar det ganska vanligt att returnera både ett p-värde och en Z-poäng för en statistik: ”Inmatningsnätverket innehåller X-kopior av underbilden G”. Ett underavbild betraktas som ett motiv om det uppfyller

p-värde < A,
Z-poäng> B och
X> C, för vissa användardefinierade (eller community-definierade) A, B och C.

Detta motiverar frågan:

Fråga : Vad är skillnaderna mellan p-värde och Z-poäng ?

Och underfrågan:

Fråga : Finns det situationer där p-värdet och Z-poängen för samma statistik kan föreslå motsatta hypoteser? Är de första och andra villkoren som anges ovan i huvudsak desamma?

Svar

Jag skulle säga, baserat på din fråga, att det inte finns någon skillnad mellan de tre testerna. Detta är i den meningen att du alltid kan välja A, B och C så att samma beslut fattas oavsett vilket kriterium du använder. Även om du måste ha p-värdet baserat på samma statistik (dvs. Z-poängen)

För att använda Z-poängen, är både medelvärdet $ \ mu $ och variansen $ \ sigma ^ 2 $ antas vara kända, och fördelningen antas vara normal (eller asymptotiskt / ungefär normal). Antag att p-värdekriteriet är de vanliga 5%. Sedan har vi:

$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Så vi har trippeln $ (0,05, 1,645, \ mu + 1,645 \ sigma) $ som alla representerar samma cut-offs.

Observera att samma korrespondens kommer att gälla för t-testet, även om siffrorna kommer att vara olika. Testet med två svansar kommer också att ha en liknande korrespondens, men med olika siffror.

Kommentarer

Tack för det! (och tack till de andra svararna också).

Svar

En $ Z $ -poäng beskriver din avvikelse från medelvärdet i enheter med standardavvikelse. Det är inte uttryckligt om du accepterar eller avvisar din nollhypotes.

A $ p $ -värde är sannolikheten att vi under nollhypotesen kan observera en punkt som är lika extrem som din statistik. Detta berättar uttryckligen om du avvisar eller accepterar din nollhypotes med en teststorlek $ \ alpha $.

Tänk på ett exempel där $ X \ sim \ mathcal {N} (\ mu, 1) $ och nullhypotesen är $ \ mu = 0 $. Sedan observerar du $ x_1 = 5 $. Din $ Z $ -poäng är 5 (som bara berättar hur långt du avviker från din nollhypotes när det gäller $ \ sigma $) och din $ p $ -värde är 5.733e-7. För 95% självförtroende kommer du att ha en teststorlek $ \ alpha = 0.05 $ och eftersom $ p < \ alpha $ så avvisar du nollhypotesen. Men för varje given statistik bör det finnas några motsvarande $ A $ och $ B $ så att testerna är desamma.

Kommentarer

@ Gary – ett p-värde säger inte ' att du ska avvisa eller inte mer än en Z-poäng. De är bara siffror. Det är bara beslutsregeln som bestämmer att acceptera eller avvisa. Denna beslutsregel kan lika gärna definieras i termer av en Z-poäng (t.ex. $ 2 \ sigma $ eller $ 3 \ sigma $ -regeln)
@probabilityislogic Jag håller med dig. I själva verket kan du konstruera ett test baserat på $ Z $ poängtröskel men det tillåter dig inte att uttryckligen definiera en teststorlek i klassisk mening (dvs i termer av sannolikhet). Denna typ av kriterier kan vara några problem om din distribution har tjocka svansar. När du konstruerar ett test definierar du uttryckligen en teststorlek och därmed säger $ p $ -värdet omedelbart om du accepterar eller avvisar, vilket är den punkt som jag försökte göra.
@gary – inte verkligen, för p-värdet hänvisar inte till alternativ. Så det kan ' inte användas för att direkt jämföra alternativ. Ta till exempel $ H_0: \ mu = 0 $ mot $ H_A: \ mu = -1 $. P-värdet för $ H_0 $ förblir detsamma $ 5 \ gånger 10 ^ {- 7} $. Så du säger " avvisa noll " vilket betyder " acceptera alternativet " och deklarera $ \ mu = -1 $. Men det här är absurt, ingen skulle göra det, men den p-värde-regel som du använder här gör det här.På ett annat sätt är den p-värde-regel som du beskrev inte oförändrad med avseende på vad som kallas " nollhypotes " (upplösning kommer )
(forts ' d) Upplösningen av den uppenbara absurditeten är att notera att p-värdet inte är ett " absolut " test, men en relativ, definierad med en implicit alternativ hypotes. I det här fallet är det implicita alternativet $ H_ {imp}: \ mu = 5 $. Du kan se detta genom att notera att om jag beräknar p-värdet på $ H_A $ får jag $ 1 \ gånger 10 ^ {- 9} $, vilket är mindre än p-värdet för $ H_0 $. Nu i det här exemplet är det " implicit alternativ " lätt att hitta med intuition, men det är mycket svårare att hitta i mer komplexa problem , där störande parametrar eller ingen tillräcklig statistik.
@Gary – p-värdet är inte strängare bara för att det är en sannolikhet. Det är en monoton 1-till-1-transformation av Z-poängen. någon " stramhet " som ägs av p-värdet har också Z-poängen. Även om du använder ett dubbelsidigt test är motsvarigheten det absoluta värdet på Z-poängen. Och för att jämföra $ H_1: \ mu \ neq 0 $ med null måste du ta en " minimax ": vilket är att välja den skarpa hypotesen som stöds mest av data och överensstämmer med $ H_1 $. Om du inte kan visa hur du beräknar $ P (X | \ mu \ neq 1) $

Svar

$ p $ -värde anger hur osannolikt statistiken är. $ z $ -poäng anger hur långt borta från medelvärdet det är. Det kan finnas en skillnad mellan dem, beroende på provstorleken.

För stora prover blir till och med små avvikelser från medelvärdet osannolikt. Dvs $ p $ -värdet kan vara väldigt litet även för en låg $ z $ -poäng. Omvänt, för små prover är inte ens stora avvikelser osannolika. Dvs en stor $ z $ -poäng betyder inte nödvändigtvis en liten $ p $ -värde.

Kommentarer

om provstorleken är stor, då standardavvikelsen kommer att vara liten, därför blir Z-poängen hög. Jag tror att du kan upptäcka detta om du försökte ett numeriskt exempel.
Inte riktigt. Antag att du samplar från N (0, 1). Då är din std ungefär 1 oavsett provstorlek. Vad som blir mindre är medelvärdets standardfel, inte standardavvikelse. p-värden baseras på SEM, inte på std.
Z-poängen är (observerat-medelvärde) / (standardavvikelse). Men medelvärdet och standardavvikelsen är av den observerade statistiken, inte av befolkningen från vilken komponenter i den togs. Min slaka terminologi har fångats här. Om du testar medelvärdet är dock lämplig standardavvikelse i Z-poäng standardfelet, som blir mindre i samma takt som p-värdet.

Svar

Kommentarer

Svar

Kommentarer

Svar

Kommentarer

Lämna ett svar Avbryt svar