Care este diferența dintre scorurile Z și valorile p?

În algoritmii cu motive de rețea, pare destul de obișnuit să returnăm atât o valoare p și un scor Z pentru o statistică: „Rețeaua de intrare conține X copii ale subgrafului G”. Un subgraf este considerat un motiv dacă satisface

  • valoarea p < A,
  • Z-score> B și
  • X> C, pentru unele A, B și C. definite de utilizator (sau definite de comunitate)

Acest lucru motivează întrebarea:

Întrebare : Care sunt diferențele dintre valoarea p și scorul Z ?

Și întrebarea secundară:

Întrebare : Există situații în care valoarea p și scorul Z ale aceleiași statistici ar putea sugera ipoteze opuse? Sunt prima și a doua condiție enumerate mai sus esențial aceleași?

Răspuns

Aș spune, pe baza întrebării dvs., că nu există nicio diferență între cele trei teste. Aceasta este în sensul că puteți alege oricând A, B și C astfel încât să se ajungă la aceeași decizie, indiferent de ce criteriu utilizați. Deși trebuie să aveți valoarea p să se bazeze pe aceeași statistică (adică scorul Z)

Pentru a utiliza scorul Z, atât media $ \ mu $ cât și varianța $ \ sigma ^ 2 Se presupune că $ este cunoscut, iar distribuția se presupune normală (sau asimptotic / aproximativ normală). Să presupunem că criteriul valorii p este 5% obișnuit. Apoi avem:

$$ p = Pr (Z > z) < 0.05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Deci avem triplul $ (0.05, 1.645, \ mu + 1.645 \ sigma) $ care reprezintă toate aceleași limite.

Rețineți că aceeași corespondență se va aplica testului t, deși numerele vor fi diferite. Testul celor două cozi va avea, de asemenea, o corespondență similară, dar cu numere diferite.

Comentarii

  • Vă mulțumim pentru asta! (și mulțumesc și celorlalți respondenți).

Răspuns

Un scor de $ Z $ descrie abaterea dvs. de la media în unități de deviație standard. Nu este explicit dacă acceptați sau respingeți ipoteza nulă.

O valoare de $ p $ este probabilitatea ca, în ipoteza nulă, să putem observa un punct la fel de extrem ca statisticile dvs. Acest lucru vă spune în mod explicit dacă respingeți sau acceptați ipoteza nulă, având în vedere dimensiunea testului $ \ alpha $.

Luați în considerare un exemplu în care $ X \ sim \ mathcal {N} (\ mu, 1) $ și ipoteza nulă este $ \ mu = 0 $. Apoi observați $ x_1 = 5 $. Scorul dvs. $ Z $ este 5 (ceea ce vă spune doar cât de departe vă abateți de la ipoteza nulă în termeni de $ \ sigma $), iar valoarea dvs. $ p $ este 5.733e-7. Pentru încredere de 95%, veți avea o dimensiune de testare $ \ alpha = 0,05 $ și din moment ce $ p < \ alpha $ atunci respingeți ipoteza nulă. Dar pentru orice statistică dată, ar trebui să existe echivalenți $ A $ și $ B $ astfel încât testele să fie aceleași.

Comentarii

  • @ Gary – o valoare p nu ' nu îți spune să respingi sau nu mai mult decât un scor Z. Sunt doar numere. Doar regula deciziei determină acceptarea sau respingerea. Această regulă de decizie ar putea fi la fel de bine definită în termeni de scor Z (de ex. Regula $ 2 \ sigma $ sau $ 3 \ sigma $)
  • @probabilityislogic Sunt de acord cu dvs. Într-adevăr, ați putea construi un test pe baza pragului de scor $ Z $, dar nu vă permite să definiți în mod explicit o dimensiune a testului în sens clasic (adică în termeni de probabilitate). Acest tip de criterii ar putea fi unele probleme dacă distribuția dvs. are cozi groase. Când construiți un test, definiți în mod explicit o dimensiune de test și astfel valoarea $ p $-vă spune imediat dacă acceptați sau respingeți, ceea ce este punctul pe care încercam să-l subliniez.
  • @gary – nu într-adevăr, pentru că valoarea p nu face nicio referire la alternative. Deci, nu poate ' să fie folosit pentru a compara direct alternativele. De exemplu, luați $ H_0: \ mu = 0 $ față de $ H_A: \ mu = -1 $. Valoarea p pentru $ H_0 $ rămâne aceeași de 5 $ \ ori 10 ^ {- 7} $. Deci, spuneți " respingeți " nul, ceea ce înseamnă că " acceptați alternativa " și declara $ \ mu = -1 $. Dar acest lucru este absurd, nimeni nu ar face acest lucru, dar regula p-value pe care o folosiți aici face asta.Altfel spus, regula p-value pe care ați descris-o nu este invariantă față de ceea ce se numește " ipoteză nulă " (rezoluția urmează )
  • (cont ' d) Rezoluția absurdității aparente este de reținut că valoarea p nu este o " absolut ", dar unul relativ, definit cu o ipoteză alternativă implicită. În acest caz, alternativa implicită este $ H_ {imp}: \ mu = 5 $. Puteți vedea acest lucru observând că, dacă calculez valoarea p de $ H_A $, obțin $ 1 \ ori 10 ^ {- 9} $, care este mai mic decât valoarea p pentru $ H_0 $. Acum, în acest exemplu, " alternativă implicită " este ușor de găsit prin intuiție, dar este mult mai greu de găsit în probleme mai complexe , unde parametrii de deranj sau lipsa unei statistici suficiente.
  • @Gary – valoarea p nu este mai riguroasă doar pentru că este o probabilitate. Este o transformare monotonă 1 la 1 a scorului Z. orice " rigoare " care este posedată de valoarea p este de asemenea posedată de scorul Z. Deși, dacă utilizați un test pe două fețe, atunci echivalentul este valoarea absolută a scorului Z. Și pentru a compara $ H_1: \ mu \ neq 0 $ cu valoarea nulă, trebuie să luați o abordare " minimax ": care este de a alege ipoteza ascuțită, care este cea mai susținută de date și în concordanță cu $ H_1 $. Cu excepția cazului în care puteți demonstra cum se calculează $ P (X | \ mu \ neq 1) $

Răspuns

Valoarea $ p $ indică cât de puțin probabilă este statistica. $ z $ -score indică cât de departe este de media. Poate exista o diferență între ele, în funcție de mărimea eșantionului.

Pentru eșantioane mari, chiar devieri puțin mici de la medie devin improbabile. Adică valoarea $ p $ poate fi foarte mică chiar și pentru un scor scăzut de $ z $. În schimb, pentru eșantioane mici, chiar și abateri mari nu sunt puțin probabil. Adică un scor mare de $ z $ nu va însemna neapărat o valoare mică de $ p $.

Comentarii

  • dacă dimensiunea eșantionului este mare, atunci deviația standard va fi mică, de aceea scorul Z va fi ridicat. Cred că ați putea descoperi acest lucru dacă ați încercat un exemplu numeric.
  • Nu chiar. Să presupunem că eșantionăm din N (0, 1). Apoi, valoarea standard va fi de aproximativ 1, indiferent de dimensiunea eșantionului. Ceea ce va deveni mai mic este eroarea standard a mediei, nu abaterea standard. Valorile p se bazează pe SEM, nu pe standard.
  • Scorul Z este (medie observată) / (deviație standard). Dar media și abaterea standard sunt ale statisticii observate, nu ale populației din care au fost extrase componentele acesteia. Terminologia mea slabă a fost surprinsă aici. Cu toate acestea, dacă testați media, abaterea standard corespunzătoare în scorul Z este eroarea standard, care devine mai mică cu aceeași rată ca valoarea p.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *