¿Cuál es la diferencia entre las puntuaciones Z y los valores p?

En los algoritmos de motivo de red, parece bastante común devolver un valor p y un Z-score para una estadística: «La red de entrada contiene X copias del subgrafo G». Un subgrafo se considera un motivo si satisface

  • p-value < A,
  • Z-score> B y
  • X> C, para algunas A, B y C definidas por el usuario (o definidas por la comunidad)

Esto motiva la pregunta:

Pregunta : ¿Cuáles son las diferencias entre el valor p y la puntuación Z? ?

Y la subpregunta:

Pregunta : ¿Existen situaciones en las que el valor p y la puntuación Z de la misma estadística podrían sugerir hipótesis opuestas? ¿Las condiciones primera y segunda enumeradas anteriormente son esencialmente las mismas?

Respuesta

Yo diría, basado en su pregunta, que no hay diferencia entre las tres pruebas. Esto es en el sentido de que siempre puede elegir A, B y C de modo que se llegue a la misma decisión independientemente del criterio que esté utilizando. Aunque es necesario que el valor p se base en la misma estadística (es decir, la puntuación Z)

Para utilizar la puntuación Z, tanto la media $ \ mu $ como la varianza $ \ sigma ^ 2 Se supone que $ son conocidos y la distribución se supone normal (o asintóticamente / aproximadamente normal). Suponga que el criterio del valor p es el 5% habitual. Entonces tenemos:

$$ p = Pr (Z > z) < 0.05 \ rightarrow Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$

Así que tenemos el triple $ (0.05, 1.645, \ mu + 1.645 \ sigma) $ que todos representan los mismos puntos de corte.

Tenga en cuenta que se aplicará la misma correspondencia a la prueba t, aunque los números serán diferentes. La prueba de dos colas también tendrá una correspondencia similar, pero con números diferentes.

Comentarios

  • ¡Gracias por eso! (y gracias también a los demás que respondieron).

Respuesta

Una puntuación de $ Z $ describe su desviación de la media en unidades de desviación estándar. No es explícito si acepta o rechaza su hipótesis nula.

Un valor de $ p $ es la probabilidad de que bajo la hipótesis nula podamos observar un punto que es tan extremo como su estadística. Esto le dice explícitamente si rechaza o acepta su hipótesis nula dado un tamaño de prueba $ \ alpha $.

Considere un ejemplo donde $ X \ sim \ mathcal {N} (\ mu, 1) $ y el la hipótesis nula es $ \ mu = 0 $. Luego observa $ x_1 = 5 $. Su puntuación $ Z $ es 5 (que solo le indica cuánto se desvía de su hipótesis nula en términos de $ \ sigma $) y su valor $ p $ es 5.733e-7. Para una confianza del 95%, tendrá un tamaño de prueba $ \ alpha = 0.05 $ y desde $ p < \ alpha $, entonces rechaza la hipótesis nula. Pero para cualquier estadística dada, debe haber un equivalente $ A $ y $ B $ de modo que las pruebas sean las mismas.

Comentarios

  • @ Gary: un valor p no ' no te dice que rechaces o no más que una puntuación Z. Son solo números. Es solo la regla de decisión la que determina aceptar o rechazar. Esta regla de decisión podría definirse igualmente bien en términos de un puntaje Z (por ejemplo, la regla $ 2 \ sigma $ o $ 3 \ sigma $)
  • @probabilityislogic Estoy de acuerdo con usted. De hecho, podría construir alguna prueba basada en el umbral de puntuación de $ Z $ pero no le permite definir explícitamente un tamaño de prueba en el sentido clásico (es decir, en términos de probabilidad). Este tipo de criterios puede ser problemático para algunos si su distribución tiene colas gruesas. Cuando construye una prueba, define explícitamente un tamaño de prueba y, por lo tanto, el valor $ p $ le dice inmediatamente si acepta o rechaza, que es el punto que estaba tratando de hacer.
  • @gary – no en realidad, el valor p no hace referencia a alternativas. Por lo tanto, puede ' t usarse para comparar alternativas directamente. Por ejemplo, tome $ H_0: \ mu = 0 $ vs $ H_A: \ mu = -1 $. El valor p para $ H_0 $ permanece igual $ 5 \ times 10 ^ {- 7} $. Entonces dices " rechaza el " nulo, lo que significa que " acepta la alternativa " y declara $ \ mu = -1 $. Pero esto es absurdo, nadie haría esto, pero la regla del valor p que usa aquí lo hace.Dicho de otra manera, la regla del valor p que describió no es invariante con respecto a lo que se llama la " hipótesis nula " (la resolución está próxima )
  • (cont ' d) La resolución del aparente absurdo es tener en cuenta que el valor p no es un " prueba " absoluta, pero relativa, definida con una hipótesis alternativa implícita. En este caso, la alternativa implícita es $ H_ {imp}: \ mu = 5 $. Puede ver esto al notar que si calculo el valor p de $ H_A $ obtengo $ 1 \ times 10 ^ {- 9} $, que es menor que el valor p de $ H_0 $. Ahora, en este ejemplo, la " alternativa implícita " es fácil de encontrar por intuición, pero es mucho más difícil de encontrar en problemas más complejos. , donde hay parámetros molestos o no hay estadísticas suficientes.
  • @Gary: el valor p no es más riguroso solo porque es una probabilidad. Es una transformación monótona 1 a 1 de la puntuación Z. cualquier " rigor " que posee el valor p también lo posee la puntuación Z. Aunque si está utilizando una prueba de dos caras, el equivalente es el valor absoluto de la puntuación Z. Y para comparar $ H_1: \ mu \ neq 0 $ con el valor nulo, debes adoptar un enfoque " minimax ": que consiste en elegir la hipótesis clara que esté más respaldada por los datos y sea coherente con $ H_1 $. A menos que pueda demostrar cómo calcular $ P (X | \ mu \ neq 1) $

Respuesta

$ p $ -valor indica cuán improbable es la estadística. $ z $ -score indica qué tan lejos de la media está. Puede haber una diferencia entre ellos, dependiendo del tamaño de la muestra.

Para muestras grandes, incluso las pequeñas desviaciones de la media se vuelven poco probables. Es decir. el valor de $ p $ puede ser muy pequeño incluso para una puntuación de $ z $ baja. Por el contrario, para muestras pequeñas no es improbable incluso grandes desviaciones. Es decir. una puntuación $ z $ grande no necesariamente significará un valor $ p $ pequeño.

Comentarios

  • si el tamaño de la muestra es grande, entonces la desviación estándar será pequeña, por lo que la puntuación Z será alta. Creo que puede descubrir esto si prueba un ejemplo numérico.
  • No realmente. Suponga que toma una muestra de N (0, 1). Entonces su std será de aproximadamente 1 independientemente del tamaño de la muestra. Lo que se hará más pequeño es el error estándar de la media, no la desviación estándar. Los valores p se basan en SEM, no en std.
  • La puntuación Z es (media observada) / (desviación estándar). Pero la media y la desviación estándar son de la estadística observada, no de la población de la que se extrajeron los componentes. Mi terminología floja ha sido atrapada aquí. Sin embargo, si está probando la media, entonces la desviación estándar apropiada en el puntaje Z es el error estándar, que se reduce al mismo ritmo que el valor p.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *