Negli algoritmi dei motivi di rete, sembra abbastanza comune restituire sia un valore p e un punteggio Z per una statistica: “La rete di input contiene X copie del sottografo G”. Un sottografo è considerato un motivo se soddisfa
- valore p < A,
- Z-score> B e
- X> C, per alcuni A, B e C definiti dallutente (o definiti dalla comunità)
Questo motiva la domanda:
Domanda : quali sono le differenze tra valore p e punteggio Z ?
E la domanda secondaria:
Domanda : ci sono situazioni in cui il valore p e il punteggio Z della stessa statistica potrebbero suggerire ipotesi opposte? La prima e la seconda condizione sopra elencate sono essenzialmente le stesse?
Risposta
Direi, sulla base della tua domanda, che non cè differenza tra i tre test. Questo nel senso che puoi sempre scegliere A, B e C in modo tale che si arrivi alla stessa decisione indipendentemente dal criterio che stai utilizzando. Sebbene sia necessario che il valore p sia basato sulla stessa statistica (cioè il punteggio Z)
Per utilizzare il punteggio Z, sia la media $ \ mu $ che la varianza $ \ sigma ^ 2 Si presume che $ sia noto e la distribuzione è considerata normale (o asintoticamente / approssimativamente normale). Supponiamo che il criterio del valore p sia il solito 5%. Quindi abbiamo:
$$ p = Pr (Z > z) < 0,05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$
Quindi abbiamo il triplo $ (0.05, 1.645, \ mu + 1.645 \ sigma) $ che rappresentano tutti gli stessi valori limite.
Nota che la stessa corrispondenza si applicherà al test t, sebbene i numeri saranno diversi. Anche il test delle due code avrà una corrispondenza simile, ma con numeri diversi.
Commenti
- Grazie per questo! (e grazie anche agli altri rispondenti).
Risposta
A $ Z $ -score descrive la tua deviazione dalla media in unità di deviazione standard. Non è esplicito se accetti o rifiuti la tua ipotesi nulla.
Un valore $ p $ è la probabilità che sotto lipotesi nulla potremmo osservare un punto estremo come la tua statistica. Questo ti dice esplicitamente se rifiuti o accetti la tua ipotesi nulla data una dimensione del test $ \ alpha $.
Considera un esempio in cui $ X \ sim \ mathcal {N} (\ mu, 1) $ e il lipotesi nulla è $ \ mu = 0 $. Quindi osservi $ x_1 = 5 $. Il tuo punteggio $ Z $ è 5 (che ti dice solo quanto ti allontani dalla tua ipotesi nulla in termini di $ \ sigma $) e il tuo valore $ p $ è 5,733e-7. Per una confidenza del 95%, avrai una dimensione del test $ \ alpha = 0,05 $ e poiché $ p < \ alpha $ respingi lipotesi nulla. Ma per ogni dato dato statistico, dovrebbe esserci qualche $ A $ e $ B $ equivalente in modo tale che i test siano gli stessi.
Commenti
- @ Gary – un valore p ' non ti dice di rifiutare o non più di un punteggio Z. Sono solo numeri. È solo la regola decisionale che determina laccettazione o il rifiuto. Questa regola decisionale potrebbe essere definita altrettanto bene in termini di punteggio Z (ad esempio la regola $ 2 \ sigma $ o $ 3 \ sigma $)
- @probabilityislogic Sono daccordo con te. In effetti, potresti costruire un test basato sulla soglia del punteggio di $ Z $ ma non ti consente di definire esplicitamente una dimensione del test in senso classico (cioè in termini di probabilità). Questo tipo di criteri potrebbe creare problemi se la tua distribuzione ha code spesse. Quando costruisci un test, definisci esplicitamente una dimensione del test e quindi il valore $ p $ ti dice immediatamente se accetti o rifiuti, che è il punto che stavo cercando di fare.
- @gary – not in realtà, poiché il valore p non fa riferimento ad alternative. Quindi non può ' essere utilizzato per confrontare direttamente le alternative. Ad esempio, prendi $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. Il valore p per $ H_0 $ rimane lo stesso $ 5 \ volte 10 ^ {- 7} $. Quindi dici " rifiuta " che significa " accetta lalternativa " e dichiara $ \ mu = -1 $. Ma questo è assurdo, nessuno lo farebbe, ma la regola del valore p che usi qui fa questo.In altre parole, la regola del valore p che hai descritto non è invariante rispetto a quella che viene chiamata " ipotesi nulla " (risoluzione in arrivo )
- (cont ' d) La risoluzione dellapparente assurdità è che il valore p non è un " test " assoluto, ma relativo, definito con unipotesi alternativa implicita. In questo caso, lalternativa implicita è $ H_ {imp}: \ mu = 5 $. Puoi vederlo notando che se calcolo il valore p di $ H_A $ ottengo $ 1 \ volte 10 ^ {- 9} $, che è inferiore al valore p di $ H_0 $. In questo esempio, l " alternativa implicita " è facile da trovare per intuizione, ma è molto più difficile da trovare in problemi più complessi , dove parametri fastidiosi o statistiche insufficienti.
- @Gary: il valore p non è più rigoroso solo perché è una probabilità. È una trasformazione monotona 1 a 1 del punteggio Z. qualsiasi " rigor " posseduto dal valore p è anche posseduto dal punteggio Z. Anche se si utilizza un test bilaterale, lequivalente è il valore assoluto del punteggio Z. E per confrontare $ H_1: \ mu \ neq 0 $ con il valore nullo, devi adottare un approccio " minimax ": ovvero scegliere lipotesi più nitida più supportata dai dati e coerente con $ H_1 $. A meno che tu non possa dimostrare come calcolare $ P (X | \ mu \ neq 1) $
Risposta
$ p $ -value indica quanto sia improbabile la statistica. $ z $ -score indica quanto è lontano dalla media. Potrebbe esserci una differenza tra loro, a seconda della dimensione del campione.
Per campioni di grandi dimensioni, anche piccole deviazioni dalla media diventano improbabili. Cioè il valore $ p $ può essere molto piccolo anche per un punteggio $ z $ basso. Al contrario, per piccoli campioni anche grandi deviazioni non sono improbabili. Cioè un punteggio $ z $ grande non significherà necessariamente un valore $ p $ basso.
Commenti
- se la dimensione del campione è grande, allora la deviazione standard sarà piccola, quindi il punteggio Z sarà alto. Penso che potresti scoprirlo se provassi un esempio numerico.
- Non proprio. Supponiamo di campionare da N (0, 1). Quindi il tuo standard sarà circa 1 indipendentemente dalla dimensione del campione. Ciò che diventerà più piccolo è lerrore standard della media, non la deviazione standard. I valori p sono basati su SEM, non su standard.
- Il punteggio Z è (media osservata) / (deviazione standard). Ma la media e la deviazione standard sono della statistica osservata, non della popolazione da cui sono stati tratti i componenti di essa. La mia terminologia debole è stata catturata qui. Tuttavia, se stai testando la media, la deviazione standard appropriata nel punteggio Z è lerrore standard, che si riduce alla stessa velocità del valore p.