W algorytmach motywów sieciowych dość często zwraca się zarówno wartość p i Z-score dla statystyki: „Sieć wejściowa zawiera X kopii podgrafu G”. Podgraf jest uważany za motyw, jeśli spełnia
- wartość p < A,
- Z-score> B i
- X> C, dla niektórych zdefiniowanych przez użytkownika (lub zdefiniowanych przez społeczność) A, B i C.
To motywuje pytanie:
Pytanie : Jakie są różnice między wartością p a wynikiem Z ?
I pytanie dodatkowe:
Pytanie : Czy są sytuacje, w których wartość p i wynik Z tej samej statystyki mogą sugerować przeciwne hipotezy? Czy pierwszy i drugi warunek wymienione powyżej zasadniczo są takie same?
Odpowiedź
Na podstawie twojego pytania powiedziałbym, że nie ma różnicy między tymi trzema testami. Dzieje się tak w tym sensie, że zawsze możesz wybrać A, B i C w taki sposób, aby ta sama decyzja została podjęta niezależnie od używanego kryterium. Chociaż musisz mieć wartość p opartą na tej samej statystyce (tj. Wyniku Z)
Aby użyć wyniku Z, zarówno średnia $ \ mu $, jak i wariancja $ \ sigma ^ 2 Zakłada się, że $ jest znany, a rozkład przyjmuje się jako normalny (lub asymptotycznie / w przybliżeniu normalny). Załóżmy, że kryterium wartości p wynosi zwykle 5%. Mamy wtedy:
$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1,645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1,645 \ rightarrow X > \ mu + 1.645 \ sigma $$
Mamy więc potrójne $ (0,05, 1,645, \ mu + 1,645 \ sigma) $, które reprezentują te same wartości odcięcia.
Zauważ, że ta sama zgodność będzie dotyczyć testu t, chociaż liczby będą się różnić. Test dwóch ogonów również będzie miał podobną korespondencję, ale z różnymi liczbami.
Komentarze
- Dzięki za to! (i dziękuję również innym ankietowanym).
Odpowiedź
A $ Z $ – wynik opisuje Twoje odchylenie od średniej w jednostkach odchylenia standardowego. Nie jest jednoznaczne, czy akceptujesz, czy odrzucasz hipotezę zerową.
Wartość $ p $ to prawdopodobieństwo, że zgodnie z hipotezą zerową moglibyśmy zaobserwować punkt tak skrajny, jak Twoja statystyka. To wyraźnie mówi ci, czy odrzucasz, czy akceptujesz hipotezę zerową, biorąc pod uwagę rozmiar testowy $ \ alpha $.
Rozważmy przykład, w którym $ X \ sim \ mathcal {N} (\ mu, 1) $ i hipoteza zerowa to $ \ mu = 0 $. Wtedy obserwujesz $ x_1 = 5 $. Twój wynik $ Z $ wynosi 5 (który mówi tylko, jak daleko odchodzisz od hipotezy zerowej w postaci $ \ sigma $), a wartość $ p $ wynosi 5,733e-7. Dla 95% pewności otrzymasz rozmiar testowy $ \ alpha = 0.05 $, a ponieważ $ p < \ alpha $, odrzucasz hipotezę zerową. Ale dla każdej statystyki powinien istnieć odpowiednik $ A $ i $ B $, tak aby testy były takie same.
Komentarze
- @ Gary – wartość p nie ' nie mówi Ci, aby odrzucić lub nie więcej niż Z-score. To tylko liczby. Dopiero reguła decyzyjna decyduje o przyjęciu lub odrzuceniu. Tę regułę decyzyjną można równie dobrze zdefiniować w kategoriach Z-score (np. Reguła 2 $ \ sigma $ lub 3 $ \ sigma $)
- @probabilityislogic Zgadzam się z tobą. Rzeczywiście, możesz skonstruować test oparty na progu wyniku $ Z $, ale nie pozwala on na jawne zdefiniowanie rozmiaru testu w klasycznym sensie (tj. W kategoriach prawdopodobieństwa). Tego rodzaju kryteria mogą być dla niektórych kłopotliwe, jeśli Twoja dystrybucja ma grube ogony. Kiedy konstruujesz test, jawnie definiujesz rozmiar testu, a zatem $ p $ -value natychmiast mówi ci, czy akceptujesz, czy odrzucasz, co jest punktem, o którym próbowałem.
- @gary – nie w rzeczywistości dla wartości p nie ma odniesienia do alternatyw. Dlatego nie można go ' używać do bezpośredniego porównywania alternatyw. Na przykład, weźmy $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. Wartość p dla $ H_0 $ pozostaje taka sama $ 5 \ times 10 ^ {- 7} $. Więc mówisz, że " odrzucasz puste ", co oznacza ", akceptujesz alternatywne " i zadeklaruj $ \ mu = -1 $. Ale to absurd, nikt by tego nie zrobił, ale reguła wartości p, której tu używasz, robi to.Innymi słowy, opisana przez ciebie reguła wartości p nie jest niezmienna w odniesieniu do tak zwanej " hipotezy zerowej " (rozwiązanie nadchodzi )
- (cd ' d) Rozwiązanie pozornego absurdu polega na tym, że wartość p nie jest " absolutny " test, ale względny, zdefiniowany za pomocą domyślnej hipotezy alternatywnej. W tym przypadku domyślną alternatywą jest $ H_ {imp}: \ mu = 5 $. Możesz to zobaczyć, zauważając, że jeśli obliczę wartość p $ H_A $, otrzymam 1 $ \ razy 10 ^ {- 9} $, czyli mniej niż wartość p dla $ H_0 $. W tym przykładzie " niejawna alternatywa " jest łatwa do znalezienia dzięki intuicji, ale znacznie trudniej jest znaleźć ją w bardziej złożonych problemach , gdzie uciążliwe parametry lub brak wystarczających statystyk.
- @Gary – wartość p nie jest bardziej rygorystyczna tylko dlatego, że jest prawdopodobieństwem. Jest to monotoniczna transformacja wyniku Z-score 1 do 1. każdy " rygor ", który posiada wartość p, jest również posiadany przez Z-score. Chociaż jeśli używasz testu dwustronnego, odpowiednikiem jest wartość bezwzględna Z-score. Aby porównać $ H_1: \ mu \ neq 0 $ z wartością zerową, musisz przyjąć podejście " minimax ": co ma na celu wybranie ostrej hipotezy, która jest najbardziej poparta danymi i zgodna z $ H_1 $. Chyba że możesz pokazać, jak obliczyć $ P (X | \ mu \ neq 1) $
Odpowiedź
$ p $ -value wskazuje, jak nieprawdopodobne są statystyki. $ z $ -score wskazuje, jak daleko jest od średniej. Mogą występować między nimi różnice w zależności od wielkości próby.
W przypadku dużych próbek nawet małe odchylenia od średniej stają się mało prawdopodobne. To znaczy. wartość $ p $ może być bardzo mała, nawet przy niskim wyniku $ z $. I odwrotnie, w przypadku małych próbek nawet duże odchylenia nie są nieprawdopodobne. To znaczy. duży wynik $ z $ nie musi oznaczać małej wartości $ p $.
Komentarze
- jeśli rozmiar próbki jest duży, to odchylenie standardowe będzie małe, stąd wynik Z będzie wysoki. Myślę, że możesz to odkryć, gdybyś wypróbował przykład liczbowy.
- Niezupełnie. Załóżmy, że próbujesz z N (0, 1). Wtedy twój standard będzie wynosił około 1, niezależnie od wielkości próbki. Mniejszy będzie błąd standardowy średniej, a nie odchylenie standardowe. Wartości p są oparte na SEM, a nie na standardowym.
- Z-score to (średnia obserwowana) / (odchylenie standardowe). Ale średnia i odchylenie standardowe dotyczą obserwowanej statystyki, a nie populacji, z której zostały wylosowane jej składniki. Tu została złapana moja luźna terminologia. Jeśli jednak testujesz średnią, to odpowiednie odchylenie standardowe w wyniku Z jest błędem standardowym, który zmniejsza się w tym samym tempie co wartość p.