¿Alguien puede aclarar qué es exactamente lo que genera el comando ttest cuando se ejecuta en un vector de números $ a_1, a_2, \ ldots, a_n $? Está bien responder en una forma como «genera el valor $ x $ que maximiza $ y $».
Me doy cuenta de que esta es probablemente una pregunta trivial para los expertos, pero no puedo encontrar fácilmente una respuesta clara.
Respuesta
Matlab «s ttest
toma su vector de datos y realiza una Student «s (una muestra) t-test en ella, asumiendo que:
- la población se refiere a usted «re probar contra, $ \ mu_ {0} $, es cero
- $ n $ es igual a
length(x)
- el nivel de significancia estadística, o error de tipo I , que está dispuesto a aceptar es del 5%; puede cambiar la cantidad de error de tipo I que está dispuesto a aceptar en los argumentos de la función
La prueba $ t $ calcula la media de los datos en x
(es decir, $ \ bar {x} = $ sum(x)/length(x)
) y su desviación estándar de muestra , $ s $, normalmente con la fórmula
\ begin {align} s = \ sqrt {\ frac {1} {n – 1} \ sum_ {i = 1} ^ {n} (x_ {i} – \ bar {x}) ^ {2}}, \ end {align}
que corrige el hecho de que $ s $ estima la verdadera desviación estándar de la población de la que x
muestrea.
Entonces, la estadística $ t $ es
\ begin {align} t = \ frac {\ bar {x} – \ mu_ {0}} {s / \ sqrt {n}} = \ frac {\ bar {x}} {s / \ sqrt {n}}, \ end {align}
porque se supone que $ \ mu_ {0} $ es igual a cero. La documentación no lo dice, así que supongo que la prueba es bidireccional $ t $ -test, lo que significa que ttest
devuelve 1 si $ t $ es mayor que tinv(0.95, length(x))
o menor que tinv(0.05, length(x))
(estas son las estadísticas t correspondientes a un nivel de significancia del 5%; debería ser el caso que tinv(0.05, length(x))
es igual a -tinv(0.95, length(x))
). De lo contrario, ttest
devuelve 0.
Comentarios
- Gracias. ¿Puedes decir qué es tinv (de nuevo, no muy claro para mí) y cómo se calcula el valor p p en una llamada [h, p] = ttest?
- La ' st distribución del estudiante es una distribución de probabilidad con un parámetro $ \ nu $ (llamado " grados de freedom ") Si x = tinv (0.95, nu), entonces para una variable aleatoria $ t $ con la distribución ' st con $ \ nu $ grados de libertad, $ P (t < = x) = 0,95 $. En otras palabras, x es el percentil 95 de esta distribución de probabilidad.
- O si lo prefiere: ttest devuelve 1 o cero. La matriz o el vector alimentado a la prueba t se analiza para determinar si el vector proviene de una población que se distribuyó normalmente. O no. El retorno de 1 significa " sí " (95% CI), cero significa no. Cero también puede significar que el vector no cumplió con el supuesto de que la media sea cero. Otros argumentos para probar tienen diferentes significados. Esto es para H = ttest (x);