In algoritmen voor netwerkmotieven lijkt het vrij gebruikelijk om zowel een p-waarde te retourneren en een Z-score voor een statistiek: “Invoernetwerk bevat X kopieën van subgraaf G”. Een subgraaf wordt als een motief beschouwd als het voldoet aan
- p-waarde < A,
- Z-score> B en
- X> C, voor sommige door de gebruiker gedefinieerde (of door de gemeenschap gedefinieerde) A, B en C.
Dit motiveert de vraag:
Vraag : wat zijn de verschillen tussen p-waarde en Z-score ?
En de subvraag:
Vraag : Zijn er situaties waarin de p-waarde en de Z-score van dezelfde statistiek tegengestelde hypothesen suggereren? Zijn de eerste en tweede hierboven genoemde voorwaarden in wezen hetzelfde?
Antwoord
Ik zou op basis van uw vraag zeggen dat er geen verschil is tussen de drie tests. Dit is in die zin dat u altijd A, B en C kunt kiezen zodat dezelfde beslissing wordt genomen, ongeacht het criterium dat u gebruikt. Hoewel u de p-waarde moet hebben gebaseerd op dezelfde statistiek (dwz de Z-score)
Om de Z-score te gebruiken, moeten zowel de gemiddelde $ \ mu $ als de variantie $ \ sigma ^ 2 $ wordt verondersteld bekend te zijn, en de verdeling wordt verondersteld normaal te zijn (of asymptotisch / ongeveer normaal). Stel dat het p-waardecriterium de gebruikelijke 5% is. Dan hebben we:
$$ p = Pr (Z > z) < 0.05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$
Dus we hebben de drievoudige $ (0.05, 1.645, \ mu + 1.645 \ sigma) $ die allemaal dezelfde grenswaarden vertegenwoordigen.
Houd er rekening mee dat dezelfde correspondentie van toepassing is op de t-test, hoewel de nummers anders zullen zijn. De twee-staarten-test zal ook een vergelijkbare overeenkomst hebben, maar met verschillende nummers.
Opmerkingen
- Bedankt daarvoor! (en ook met dank aan de andere beantwoorders).
Antwoord
A $ Z $ -score beschrijft je afwijking van het gemiddelde in eenheden van standaarddeviatie. Het is niet expliciet of u uw nulhypothese accepteert of verwerpt.
A $ p $ -waarde is de kans dat we onder de nulhypothese een punt zouden kunnen waarnemen dat even extreem is als uw statistiek. Dit vertelt je expliciet of je je nulhypothese verwerpt of accepteert, gegeven een testgrootte $ \ alpha $.
Beschouw een voorbeeld waarin $ X \ sim \ mathcal {N} (\ mu, 1) $ en de nulhypothese is $ \ mu = 0 $. Dan zie je $ x_1 = 5 $. Je $ Z $ -score is 5 (wat je alleen vertelt hoe ver je afwijkt van je nulhypothese in termen van $ \ sigma $) en je $ p $ -waarde is 5,733e-7. Voor 95% betrouwbaarheid heeft u een testgrootte $ \ alpha = 0.05 $ en aangezien $ p < \ alpha $, dan verwerpt u de nulhypothese. Maar voor elke gegeven statistiek zou er een equivalent $ A $ en $ B $ moeten zijn, zodat de tests hetzelfde zijn.
Opmerkingen
- @ Gary – een p-waarde zegt niet ' je te verwerpen of niet meer dan een Z-score. Het zijn maar cijfers. Alleen de beslissingsregel bepaalt het accepteren of verwerpen. Deze beslissingsregel kan net zo goed worden gedefinieerd in termen van een Z-score (bijvoorbeeld de $ 2 \ sigma $ of $ 3 \ sigma $ regel).
- @probabilityislogic Ik ben het met je eens. Je zou inderdaad een test kunnen construeren op basis van de $ Z $ scoredrempel, maar het staat je niet toe om expliciet een testgrootte te definiëren in de klassieke zin (d.w.z. in termen van waarschijnlijkheid). Dit soort criteria kan sommigen lastig zijn als uw distributie dikke staarten heeft. Wanneer je een test maakt, definieer je expliciet een testgrootte en dus vertelt de $ p $ -waarde je onmiddellijk of je accepteert of weigert, en dat is het punt dat ik probeerde te maken.
- @gary – niet echt, want de p-waarde verwijst niet naar alternatieven. Het kan dus ' niet worden gebruikt om alternatieven direct te vergelijken. Neem bijvoorbeeld $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. De p-waarde voor $ H_0 $ blijft hetzelfde $ 5 \ maal 10 ^ {- 7} $. Dus je zegt " verwerp de null " wat betekent " accepteer het alternatief " en declareer $ \ mu = -1 $. Maar dit is absurd, niemand zou dit doen, maar de p-waarde regel die je hier gebruikt doet dit.Anders gezegd, de p-waarde regel die u heeft beschreven is niet invariant ten opzichte van wat de " nulhypothese " wordt genoemd (resolutie komt )
- (cont ' d) De oplossing van de schijnbare absurditeit is dat de p-waarde geen " absolute " test, maar een relatieve, gedefinieerd met een impliciete alternatieve hypothese. In dit geval is het impliciete alternatief $ H_ {imp}: \ mu = 5 $. Je kunt dit zien door op te merken dat als ik de p-waarde van $ H_A $ bereken, ik $ 1 \ maal 10 ^ {- 9} $ krijg, wat kleiner is dan de p-waarde voor $ H_0 $. In dit voorbeeld is het " impliciete alternatief " gemakkelijk te vinden door intuïtie, maar het is veel moeilijker te vinden bij complexere problemen , waar hinderlijke parameters of geen voldoende statistiek.
- @Gary – de p-waarde is niet meer rigoureus alleen omdat het een waarschijnlijkheid is. Het is een monotone 1-op-1 transformatie van de Z-score. elke " rigor " die in het bezit is van de p-waarde, wordt ook bezeten door de Z-score. Hoewel als u een tweezijdige test gebruikt, het equivalent de absolute waarde van de Z-score is. En om $ H_1: \ mu \ neq 0 $ te vergelijken met de nul, moet je een " minimax " benadering gebruiken: dat is om de scherpe hypothese te kiezen die het meest wordt ondersteund door de gegevens en consistent is met $ H_1 $. Tenzij u kunt aantonen hoe u $ P (X | \ mu \ neq 1) $
Answer
berekent $ p $ -value geeft aan hoe onwaarschijnlijk de statistiek is. $ z $ -score geeft aan hoe ver het verwijderd is van het gemiddelde. Afhankelijk van de steekproefomvang kan er een verschil tussen beide zijn.
Voor grote steekproeven worden zelfs kleine afwijkingen van het gemiddelde onwaarschijnlijk. D.w.z. de $ p $ -waarde kan zelfs voor een lage $ z $ -score erg klein zijn. Omgekeerd zijn voor kleine monsters zelfs grote afwijkingen niet onwaarschijnlijk. D.w.z. een grote $ z $ -score betekent niet noodzakelijk een kleine $ p $ -waarde.
Opmerkingen
- als de steekproefomvang groot is, dan de standaarddeviatie zal klein zijn, dus de Z-score zal hoog zijn. Ik denk dat je dit misschien ontdekt als je een numeriek voorbeeld probeert.
- Niet echt. Stel dat u bemonstert uit N (0, 1). Dan is uw standaard ongeveer 1, ongeacht de steekproefomvang. Wat kleiner wordt, is de standaardfout van het gemiddelde, niet de standaarddeviatie. p-waarden zijn gebaseerd op SEM, niet op std.
- De Z-score is (waargenomen gemiddelde) / (standaarddeviatie). Maar de gemiddelde en standaarddeviatie zijn van de waargenomen statistiek, niet van de populatie waaruit componenten ervan zijn getrokken. Mijn slappe terminologie is hier opgevangen. Als u echter het gemiddelde test, is de juiste standaarddeviatie in de Z-score de standaardfout, die kleiner wordt met dezelfde snelheid als de p-waarde.