Mi a különbség a Z-pontszámok és a p-értékek között?

A hálózati motívum algoritmusokban meglehetősen általánosnak tűnik mindkét p-érték visszaadása és egy Z-pontszám egy statisztikához: “Az input hálózat X másolatot tartalmaz a G algráfból”. Az algráf akkor tekinthető motívumnak, ha kielégíti

  • p-érték < A,
  • Z-score> B és
  • X> C, néhány felhasználó által definiált (vagy közösség által definiált) A, B és C esetében.

Ez motiválja a kérdést:

kérdés: Mi a különbség a p-érték és a Z-pontszám között ?

És az alkérdés:

kérdés: Vannak-e olyan helyzetek, amikor ugyanazon statisztika p-értéke és Z-pontja ellentétes hipotézisekre utalhat? A fent felsorolt első és második feltétel lényegében megegyezik?

Válasz

A kérdése alapján azt mondanám, hogy nincs különbség a három teszt között. Ez abban az értelemben van, hogy mindig választhatja az A, a B és a C lehetőséget, így ugyanaz a döntés születik, függetlenül attól, hogy milyen kritériumot használ. Bár a p-értéknek ugyanazon a statisztikán kell alapulnia (pl. A Z-pontszám).

A Z-pontszám használatához mind az átlagos $ \ mu $, mind a $ \ sigma ^ 2 szórás Feltételezzük, hogy a $ ismeretes, és az eloszlást normálnak (vagy aszimptotikusan / megközelítőleg normálisnak) feltételezzük. Tegyük fel, hogy a p-érték kritériuma a szokásos 5%. Akkor:

$$ p = Pr (Z > z) < 0,05 \ jobbra nyíl Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Tehát megvan a hármas $ (0.05, 1.645, \ mu + 1.645 \ sigma) $, amelyek mindegyike ugyanazt a határértéket képviseli.

Ne feledje, hogy ugyanaz a megfelelés érvényes a t-tesztre, bár a számok eltérőek lesznek. A két farok teszt szintén hasonló levelezésű lesz, de különböző számokkal.

Hozzászólások

  • Köszönöm ezt! (és köszönet illeti a többi válaszolót is).

Válasz

A $ Z $ -pontszám leírja eltérését a szórás mértékegységeinek átlagától. Nem egyértelmű, hogy elfogadja-e vagy elutasítja-e a nullhipotézisét.

A $ p $ -érték annak a valószínűsége, hogy a nullhipotézis alatt egy olyan pontot figyelhetünk meg, amely annyira extrém, mint a statisztikája. Ez kifejezetten megmondja, hogy elutasítja-e vagy elfogadja-e a nullhipotézisét, ha a tesztméret $ \ alpha $.

Vegyünk egy példát, ahol $ X \ sim \ mathcal {N} (\ mu, 1) $ és nullhipotézis: $ \ mu = 0 $. Ezután megfigyeled a $ x_1 = 5 $ értéket. A $ Z $ pontszámod 5 (ami csak azt mondja meg, hogy meddig térsz el a null hipotézistől a $ \ sigma $ szempontjából), a $ p $ értéke pedig 5.733e-7. 95% -os megbízhatóság érdekében tesztmérete lesz $ \ alpha = 0.05 $, és mivel $ p < \ alpha $, akkor elutasítja a nullhipotézist. De egy adott statisztika esetében kell lennie valamilyen egyenértékű $ A $ és $ B $ értéknek, hogy a tesztek megegyezzenek.

Megjegyzések

  • @ Gary – egy p-érték nem ' azt mondja, hogy utasítson el vagy legfeljebb Z-pontszámot. Csak számok. Csak a döntési szabály határozza meg az elfogadást vagy az elutasítást. Ez a döntési szabály ugyanúgy meghatározható egy Z-pontszám alapján (például a $ 2 \ sigma $ vagy $ 3 \ sigma $ szabály)
  • @probabilityislogic Egyetértek veled. Valójában összeállíthat egy tesztet a $ Z $ pontszámküszöb alapján, de ez nem teszi lehetővé a teszt méretének kifejezett meghatározását a klasszikus értelemben (azaz a valószínűség szempontjából). Ez a fajta feltétel bizonyos problémákat okozhat, ha disztribúciójának vastag farka van. A teszt összeállításakor kifejezetten meghatározza a teszt méretét, és így a $ p $ -value azonnal megmondja, elfogadja-e vagy elutasítja-e ezt a pontot.
  • @gary – nem mert a p-érték nem utal alternatívákra. Tehát ' nem használható az alternatívák közvetlen összehasonlítására. Vegyük például: $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. A $ H_0 $ p értéke ugyanaz marad, mint $ 5 \ szorzat 10 ^ {- 7} $. Tehát azt mondja, hogy " elutasítja a null " -t, ami azt jelenti, hogy " elfogadja az alternatív " és deklarálja a $ \ mu = -1 $ értéket. De ez abszurd, senki sem tenne ilyet, de az itt használt p-érték szabály ezt teszi.Másképp fogalmazva: az Ön által leírt p-érték szabály nem invariáns az úgynevezett " null hipotézis " szempontjából (a felbontás jön )
  • (cont ' d) A látszólagos abszurditás feloldása az, hogy a p-érték nem " abszolút " teszt, de egy relatív, implicit alternatív hipotézissel definiálva. Ebben az esetben az implicit alternatíva a $ H_ {imp}: \ mu = 5 $. Ezt úgy láthatja, hogy megjegyzi, hogy ha kiszámítom a $ H_A $ p-értékét, akkor $ 1 \ -szer 10 ^ {- 9} $ -ot kapok, ami kisebb, mint a $ H_0 $ p-értéke. Ebben a példában a " implicit alternatívát " intuíció alapján könnyű megtalálni, de összetettebb problémáknál sokkal nehezebb megtalálni , ahol kellemetlen paraméterek vagy nincs elegendő statisztika.
  • @Gary – a p-érték már csak azért sem szigorúbb, mert valószínűség. Ez egy monoton transzformáció a Z-pontról. minden olyan " szigor ", amely a p-érték birtokában van, a Z-pontszám is rendelkezik. Bár ha kétoldalas tesztet használ, akkor az egyenérték a Z-pontszám abszolút értéke. A $ H_1: \ mu \ neq 0 $ és a null összehasonlításához pedig " minimax " megközelítést kell alkalmaznia: amely az adatok által leginkább támogatott és a $ H_1 $ -nak megfelelő éles hipotézist választja ki. Hacsak nem tudja bemutatni, hogyan kell kiszámítani a $ P (X | \ mu \ neq 1) $ értéket

Válasz

A $ p $ -value jelzi, hogy a statisztika mennyire valószínűtlen. A $ z $ -score jelzi, hogy milyen messze van az átlagtól. A minta méretétől függően eltérés lehet közöttük.

Nagy minták esetén még az átlagtól való kicsi eltérések sem valószínűek. Azaz. a $ p $ -érték nagyon kicsi lehet még alacsony $ z $ -score esetén is. Ezzel szemben a kis minták esetében még a nagy eltérések sem valószínűek. Azaz. a nagy $ z $ -score nem feltétlenül jelent kis $ p $ -értéket.

Megjegyzések

  • ha a minta mérete nagy, akkor a szórás kicsi lesz, ezért a Z-pont magas lesz. Azt hiszem, felfedezheti ezt, ha kipróbált egy numerikus példát.
  • Nem igazán. Tegyük fel, hogy N-ből (0, 1) vett mintát. Ekkor az alapértéke körülbelül 1 lesz, a minta méretétől függetlenül. Ami kisebb lesz, az átlag standard hibája, nem pedig a szórás. A p-értékek a SEM-en alapulnak, nem az standardon.
  • A Z-pontszám (megfigyelt átlag) / (szórás). Ám az átlag és a szórás a megfigyelt statisztikáké, nem pedig azon populációé, amelyből annak összetevőit vontuk le. Laza terminológiámat itt fogták el. Ha azonban az átlagot teszteli, akkor a Z-pontszám megfelelő szórása a standard hiba, amely a p-értékkel megegyező ütemben kisebb lesz.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük