Calcular la desviación estándar del tamaño de la muestra, la media y el intervalo de confianza.

Me pregunto si puedo volver a calcular la desviación estándar de la media, el tamaño de la muestra y el intervalo de confianza.

Por ejemplo: edad media = 40,2; tamaño de muestra = 427; e intervalo de confianza del 95% = (38,9-41,5)

Y si es así, ¿se puede aplicar a la medida del porcentaje, por ejemplo: porcentaje de hombres = 64,2%; tamaño de la muestra = 427; e intervalo de confianza del 95% = (59,4-68,7).

Comentarios

  • Si está asumiendo una distribución normal, entonces la fórmula para los puntos finales del El intervalo de confianza es estrictamente una función de la desviación estándar de la muestra. Se dan las otras variables, la media y el tamaño de la muestra. No ' sé lo que quiere decir con " medida de porcentaje ". Así que no puedo ' ayudarte con eso.
  • Por medida de porcentaje, simplemente me refiero a que el 64,2% de la muestra es hombre.

Respuesta

  • La desviación estándar para porcentaje / proporción es:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Por lo tanto, cuando se le da un porcentaje, puede encontrar directamente el estándar desviación.

  • Para retroceso , sabemos, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Para el 95%, $ z = 1.96 $ , N = 427, $ p = 0.642 $

    $ \ sigma =? $

Por lo tanto, use la fórmula anterior y reemplace.

  • Si su el tamaño de la muestra es menor que 30 (N < 30) , debe usar un valor t en lugar de valor Z ( calculadora de valor t ). El valor t tiene grados de libertad $ df = N-1 $ y $ {\ rm prob} = (1- \ alpha) / 2 $ .

Por lo tanto, la fórmula es: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Comentarios

  • Este método utiliza el teorema del límite central y por lo que solo es precisa en el límite de $ N $ grandes.
  • Tienes razón, di la fórmula ya que la pregunta tenía un tamaño de muestra grande > 30. Entonces el CLT ya está en vigor. Para un tamaño de muestra más pequeño, podemos usar la distribución T en lugar de la distribución Z con el grado de libertad apropiado.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ es aplicable a la distribución de Bernoulli solo, no se aplica a otras distribuciones.

Responder

Un poco tarde para la fiesta, pero noté que la segunda parte de la pregunta no se abordó por completo: «¿se puede aplicar a la medida porcentual»?

Siguiendo el comentario de los PO, supongo que por «medida porcentual» nos referimos a algún resultado binario ( Hombre / Mujer, diestro / zurdo, etc.).

En ese caso, las variables se describen mediante una distribución de probabilidad discreta, mientras que la edad es una variable continua y se describe mediante una distribución de probabilidad continua. Una opción común para la distribución de variables binarias es la distribución binomial. Los intervalos de confianza para el binomio se pueden construir de diferentes formas ( wiki ). El estudio original debería haber descrito cómo derivaron esos intervalos de confianza.

Tenga en cuenta que aún puede usar la fórmula proporcionada por el usuario3808268 para obtener la «desviación estándar», pero sería difícil de interpretar de manera significativa.

Respuesta

A partir de la descripción que proporcionó, su primera pregunta es sobre la distribución de la edad de las personas. Normal (es decir, Gauss ) se aplica a este tipo de aplicaciones.

Será útil si sabe cómo se calculó el intervalo de confianza (IC), porque hay muchas formas posibles de calcular el IC. Por ejemplo, si la distribución es de distribución normal y el IC se calculó mediante la prueba t, luego la DE se puede estimar con la siguiente ecuación:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

donde CL es el nivel de confianza, ci_upper y ci_lower son los límites superior e inferior de CI respectivamente, y «tinv () «es la inversa de la CDF de T de Student.

De lo contrario, si es de distribución normal, pero se usó una DE conocida para calcular el IC, entonces la DE se puede calcular con la siguiente ecuación:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh ere «erfinv ()» es la función de error inverso.

Su segunda pregunta es sobre la distribución del sexo de las personas (es decir,masculino o femenino). A partir de los datos que proporcionó, parece que hay k = 274 hombres entre n = 427 de las muestras completas. La distribución de Bernoulli se aplica a esta aplicación. En este caso, la varianza (de la población masculina) = p * (1-p) = 0.2299 y SD = sqrt (0.2299) = 0.4795, donde p es el valor medio. Tenga en cuenta que " valiance = mean * (1-mean) " solo se aplica a la distribución de Bernoulli.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *