Jaka jest różnica między wynikami Z a wartościami p?

W algorytmach motywów sieciowych dość często zwraca się zarówno wartość p i Z-score dla statystyki: „Sieć wejściowa zawiera X kopii podgrafu G”. Podgraf jest uważany za motyw, jeśli spełnia

  • wartość p < A,
  • Z-score> B i
  • X> C, dla niektórych zdefiniowanych przez użytkownika (lub zdefiniowanych przez społeczność) A, B i C.

To motywuje pytanie:

Pytanie : Jakie są różnice między wartością p a wynikiem Z ?

I pytanie dodatkowe:

Pytanie : Czy są sytuacje, w których wartość p i wynik Z tej samej statystyki mogą sugerować przeciwne hipotezy? Czy pierwszy i drugi warunek wymienione powyżej zasadniczo są takie same?

Odpowiedź

Na podstawie twojego pytania powiedziałbym, że nie ma różnicy między tymi trzema testami. Dzieje się tak w tym sensie, że zawsze możesz wybrać A, B i C w taki sposób, aby ta sama decyzja została podjęta niezależnie od używanego kryterium. Chociaż musisz mieć wartość p opartą na tej samej statystyce (tj. Wyniku Z)

Aby użyć wyniku Z, zarówno średnia $ \ mu $, jak i wariancja $ \ sigma ^ 2 Zakłada się, że $ jest znany, a rozkład przyjmuje się jako normalny (lub asymptotycznie / w przybliżeniu normalny). Załóżmy, że kryterium wartości p wynosi zwykle 5%. Mamy wtedy:

$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1,645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1,645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Mamy więc potrójne $ (0,05, 1,645, \ mu + 1,645 \ sigma) $, które reprezentują te same wartości odcięcia.

Zauważ, że ta sama zgodność będzie dotyczyć testu t, chociaż liczby będą się różnić. Test dwóch ogonów również będzie miał podobną korespondencję, ale z różnymi liczbami.

Komentarze

  • Dzięki za to! (i dziękuję również innym ankietowanym).

Odpowiedź

A $ Z $ – wynik opisuje Twoje odchylenie od średniej w jednostkach odchylenia standardowego. Nie jest jednoznaczne, czy akceptujesz, czy odrzucasz hipotezę zerową.

Wartość $ p $ to prawdopodobieństwo, że zgodnie z hipotezą zerową moglibyśmy zaobserwować punkt tak skrajny, jak Twoja statystyka. To wyraźnie mówi ci, czy odrzucasz, czy akceptujesz hipotezę zerową, biorąc pod uwagę rozmiar testowy $ \ alpha $.

Rozważmy przykład, w którym $ X \ sim \ mathcal {N} (\ mu, 1) $ i hipoteza zerowa to $ \ mu = 0 $. Wtedy obserwujesz $ x_1 = 5 $. Twój wynik $ Z $ wynosi 5 (który mówi tylko, jak daleko odchodzisz od hipotezy zerowej w postaci $ \ sigma $), a wartość $ p $ wynosi 5,733e-7. Dla 95% pewności otrzymasz rozmiar testowy $ \ alpha = 0.05 $, a ponieważ $ p < \ alpha $, odrzucasz hipotezę zerową. Ale dla każdej statystyki powinien istnieć odpowiednik $ A $ i $ B $, tak aby testy były takie same.

Komentarze

  • @ Gary – wartość p nie ' nie mówi Ci, aby odrzucić lub nie więcej niż Z-score. To tylko liczby. Dopiero reguła decyzyjna decyduje o przyjęciu lub odrzuceniu. Tę regułę decyzyjną można równie dobrze zdefiniować w kategoriach Z-score (np. Reguła 2 $ \ sigma $ lub 3 $ \ sigma $)
  • @probabilityislogic Zgadzam się z tobą. Rzeczywiście, możesz skonstruować test oparty na progu wyniku $ Z $, ale nie pozwala on na jawne zdefiniowanie rozmiaru testu w klasycznym sensie (tj. W kategoriach prawdopodobieństwa). Tego rodzaju kryteria mogą być dla niektórych kłopotliwe, jeśli Twoja dystrybucja ma grube ogony. Kiedy konstruujesz test, jawnie definiujesz rozmiar testu, a zatem $ p $ -value natychmiast mówi ci, czy akceptujesz, czy odrzucasz, co jest punktem, o którym próbowałem.
  • @gary – nie w rzeczywistości dla wartości p nie ma odniesienia do alternatyw. Dlatego nie można go ' używać do bezpośredniego porównywania alternatyw. Na przykład, weźmy $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. Wartość p dla $ H_0 $ pozostaje taka sama $ 5 \ times 10 ^ {- 7} $. Więc mówisz, że " odrzucasz puste ", co oznacza ", akceptujesz alternatywne " i zadeklaruj $ \ mu = -1 $. Ale to absurd, nikt by tego nie zrobił, ale reguła wartości p, której tu używasz, robi to.Innymi słowy, opisana przez ciebie reguła wartości p nie jest niezmienna w odniesieniu do tak zwanej " hipotezy zerowej " (rozwiązanie nadchodzi )
  • (cd ' d) Rozwiązanie pozornego absurdu polega na tym, że wartość p nie jest " absolutny " test, ale względny, zdefiniowany za pomocą domyślnej hipotezy alternatywnej. W tym przypadku domyślną alternatywą jest $ H_ {imp}: \ mu = 5 $. Możesz to zobaczyć, zauważając, że jeśli obliczę wartość p $ H_A $, otrzymam 1 $ \ razy 10 ^ {- 9} $, czyli mniej niż wartość p dla $ H_0 $. W tym przykładzie " niejawna alternatywa " jest łatwa do znalezienia dzięki intuicji, ale znacznie trudniej jest znaleźć ją w bardziej złożonych problemach , gdzie uciążliwe parametry lub brak wystarczających statystyk.
  • @Gary – wartość p nie jest bardziej rygorystyczna tylko dlatego, że jest prawdopodobieństwem. Jest to monotoniczna transformacja wyniku Z-score 1 do 1. każdy " rygor ", który posiada wartość p, jest również posiadany przez Z-score. Chociaż jeśli używasz testu dwustronnego, odpowiednikiem jest wartość bezwzględna Z-score. Aby porównać $ H_1: \ mu \ neq 0 $ z wartością zerową, musisz przyjąć podejście " minimax ": co ma na celu wybranie ostrej hipotezy, która jest najbardziej poparta danymi i zgodna z $ H_1 $. Chyba że możesz pokazać, jak obliczyć $ P (X | \ mu \ neq 1) $

Odpowiedź

$ p $ -value wskazuje, jak nieprawdopodobne są statystyki. $ z $ -score wskazuje, jak daleko jest od średniej. Mogą występować między nimi różnice w zależności od wielkości próby.

W przypadku dużych próbek nawet małe odchylenia od średniej stają się mało prawdopodobne. To znaczy. wartość $ p $ może być bardzo mała, nawet przy niskim wyniku $ z $. I odwrotnie, w przypadku małych próbek nawet duże odchylenia nie są nieprawdopodobne. To znaczy. duży wynik $ z $ nie musi oznaczać małej wartości $ p $.

Komentarze

  • jeśli rozmiar próbki jest duży, to odchylenie standardowe będzie małe, stąd wynik Z będzie wysoki. Myślę, że możesz to odkryć, gdybyś wypróbował przykład liczbowy.
  • Niezupełnie. Załóżmy, że próbujesz z N (0, 1). Wtedy twój standard będzie wynosił około 1, niezależnie od wielkości próbki. Mniejszy będzie błąd standardowy średniej, a nie odchylenie standardowe. Wartości p są oparte na SEM, a nie na standardowym.
  • Z-score to (średnia obserwowana) / (odchylenie standardowe). Ale średnia i odchylenie standardowe dotyczą obserwowanej statystyki, a nie populacji, z której zostały wylosowane jej składniki. Tu została złapana moja luźna terminologia. Jeśli jednak testujesz średnią, to odpowiednie odchylenie standardowe w wyniku Z jest błędem standardowym, który zmniejsza się w tym samym tempie co wartość p.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *