V algoritmech síťových motivů se zdá docela běžné vrátit p-hodnotu a Z-skóre pro statistiku: „Vstupní síť obsahuje X kopií podgrafu G“. Podgraf je považován za motiv, pokud vyhovuje
- p-value < A,
- Z-score> B a
- X> C, pro některé uživatelem definované (nebo definované komunitou) A, B a C.
To motivuje otázku:
Otázka : Jaké jsou rozdíly mezi hodnotou p a Z-skóre ?
A podotázka:
Otázka : Existují situace, kdy p-hodnota a Z-skóre stejné statistiky mohou naznačovat opačné hypotézy? Jsou první a druhá podmínka uvedené výše v zásadě stejné?
Odpověď
Řekl bych, na základě vaší otázky, že mezi těmito třemi testy není žádný rozdíl. To je v tom smyslu, že můžete vždy zvolit A, B a C tak, aby bylo dosaženo stejného rozhodnutí bez ohledu na to, jaké kritérium používáte. I když musíte mít hodnotu p založenou na stejné statistice (tj. Z-skóre)
Chcete-li použít Z-skóre, znamená to jak průměr $ \ mu $, tak rozptyl $ \ sigma ^ 2 $ se považuje za známé a distribuce se považuje za normální (nebo asymptoticky / přibližně normální). Předpokládejme, že kritérium p-hodnoty je obvyklých 5%. Pak máme:
$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1,645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1,645 \ rightarrow X > \ mu + 1.645 \ sigma $$
Takže máme trojí $ (0,05, 1,645, \ mu + 1,645 \ sigma) $, které všechny představují stejné mezní hodnoty.
Pamatujte, že stejná korespondence bude platit i pro t-test, i když čísla se budou lišit. Test dvou ocasů bude mít také podobnou korespondenci, ale s různými čísly.
Komentáře
- Díky za to! (a také díky ostatním odpovědným).
Odpověď
A $ Z $ -score popisuje vaši odchylku od průměru v jednotkách směrodatné odchylky. Není jasné, zda svou nulovou hypotézu přijímáte nebo odmítáte.
Hodnota $ p $ je pravděpodobnost, že v rámci nulové hypotézy bychom mohli pozorovat bod, který je stejně extrémní jako vaše statistika. Toto vám výslovně řekne, zda odmítnete nebo přijmete svou nulovou hypotézu vzhledem k velikosti testu $ \ alpha $.
Zvažte příklad, kde $ X \ sim \ mathcal {N} (\ mu, 1) $ a nulová hypotéza je $ \ mu = 0 $. Pak pozorujete $ x_1 = 5 $. Vaše skóre $ Z $ je 5 (což vám pouze říká, jak daleko se odchýlíte od nulové hypotézy ve smyslu $ \ sigma $) a vaše hodnota $ p $ je 5,733e-7. Pro 95% spolehlivost budete mít velikost testu $ \ alpha = 0,05 $ a od $ p < \ alpha $ pak nulovou hypotézu odmítnete. Ale pro každou danou statistiku by měl existovat ekvivalent $ A $ a $ B $, aby byly testy stejné.
Komentáře
- @ Gary – hodnota p vám ' neříká, abyste odmítli nebo ne více než Z-skóre. Jsou to jen čísla. Je to pouze rozhodovací pravidlo, které určuje přijetí nebo odmítnutí. Toto rozhodovací pravidlo lze stejně dobře definovat z hlediska skóre Z (např. Pravidlo $ 2 \ sigma $ nebo $ 3 \ sigma $)
- @probabilityislogic souhlasím s vámi. Ve skutečnosti byste mohli sestrojit nějaký test založený na prahové hodnotě $ Z $ skóre, ale to vám neumožňuje explicitně definovat velikost testu v klasickém smyslu (tj. Z hlediska pravděpodobnosti). Tento druh kritérií může některým způsobovat potíže, pokud má vaše distribuce silné ocasy. Když vytváříte test, explicitně definujete velikost testu, a proto vám hodnota $ p $ okamžitě řekne, zda přijímáte nebo odmítáte, což je bod, o který jsem se pokoušel.
- @gary – ne ve skutečnosti hodnota p neodkazuje na alternativy. Nelze jej tedy ' použít k přímému porovnání alternativ. Vezměte například $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. Hodnota p pro $ H_0 $ zůstane stejná $ 5 \ krát 10 ^ {- 7} $. Takže řeknete " odmítnout null " což znamená " přijmout alternativní " a deklarovat $ \ mu = -1 $. Ale to je absurdní, nikdo by to neudělal, ale pravidlo p-hodnoty, které zde použijete, to dělá.Jinými slovy, popsané pravidlo p-hodnoty není invariantní vzhledem k tomu, co se nazývá " nulová hypotéza " (řešení přichází )
- (pokračování ' d) Řešení zjevné absurdity je poznámka, že hodnota p není " absolutní " test, ale relativní, definovaný implicitní alternativní hypotézou. V tomto případě je implicitní alternativou $ H_ {imp}: \ mu = 5 $. Můžete to vidět poznamenáním, že když vypočítám p-hodnotu $ H_A $, dostanu $ 1 \ krát 10 ^ {- 9} $, což je menší hodnota než p-hodnota pro $ H_0 $. V tomto příkladu je " implicitní alternativa " snadno najít pomocí intuice, ale ve složitějších problémech je mnohem těžší ji najít. , kde obtěžující parametry nebo žádná dostatečná statistika.
- @Gary – p-hodnota není o nic přísnější, protože jde o pravděpodobnost. Jedná se o monotónní transformaci Z-skóre 1: 1. jakoukoli " přísnost ", která má hodnotu p, má také Z-skóre. I když používáte oboustranný test, pak ekvivalentem je absolutní hodnota Z-skóre. A aby bylo možné porovnat $ H_1: \ mu \ neq 0 $ s hodnotou null, musíte použít přístup " minimax ": což je vybrat ostrou hypotézu, která je nejvíce podporována daty a je v souladu s $ H_1 $. Pokud neprokážete, jak vypočítat $ P (X | \ mu \ neq 1) $
Odpověď
$ p $ -value udává, jak nepravděpodobná je statistika. $ z $ -score označuje, jak daleko od průměru je. Může se mezi nimi lišit v závislosti na velikosti vzorku.
U velkých vzorků jsou nepravděpodobné ani malé odchylky od střední hodnoty. Tj. hodnota $ p $ může být velmi malá i při nízkém skóre $ z $. Naopak u malých vzorků nejsou nepravděpodobné ani velké odchylky. Tj. velké $ z $ -score nemusí nutně znamenat malou $ p $ -hodnotu.
Komentáře
- pokud je velikost vzorku velká, pak směrodatná odchylka bude malá, proto bude Z-skóre vysoké. Myslím, že to můžete zjistit, pokud jste vyzkoušeli numerický příklad.
- Ve skutečnosti ne. Předpokládejme, že vzorkujete z N (0, 1). Pak bude vaše standardní hodnota asi 1 bez ohledu na velikost vzorku. Zmenší se standardní chyba průměru, nikoli směrodatná odchylka. p-hodnoty jsou založeny na SEM, nikoli na standardu.
- Z-skóre je (pozorovaný průměr) / (standardní odchylka). Průměr a směrodatná odchylka jsou však pozorované statistiky, nikoli populace, ze které byly čerpány její složky. Byla zde zachycena moje uvolněná terminologie. Pokud však testujete průměr, pak příslušnou směrodatnou odchylkou v Z-skóre je standardní chyba, která se zmenšuje stejnou rychlostí jako hodnota p.