Kan noen avklare hva som egentlig sendes ut av kommandoen ttest når den kjøres på en vektor med tall $ a_1, a_2, \ ldots, a_n $? OK å svare i en form som «det gir verdien $ x $ som maksimerer $ y $.»
Jeg er klar over at dette sannsynligvis er et trivielt spørsmål for ekspertene, men jeg kan ikke lett finne en klart svar.
Svar
Matlab «s ttest
tar datavektoren din og utfører en Student «s (en-prøve) t-test på den, forutsatt at:
- befolkningen betyr deg «re testing mot, $ \ mu_ {0} $, er null
- $ n $ er lik
length(x)
- nivået på statistisk signficance, eller Type I-feil , du er villig til å godta er 5%. Du kan endre mengden Type I-feil du er villig til å godta i argumentene for funksjonen
$ t $ -test beregner gjennomsnittet av dataene i x
(dvs. $ \ bar {x} = $ sum(x)/length(x)
), og dens eksempler på standardavvik , $ s $, vanligvis med formelen
\ begynn {align} s = \ sqrt {\ frac {1} {n – 1} \ sum_ {i = 1} ^ {n} (x_ {i} – \ bar {x}) ^ {2}}, \ slutt {align}
som korrigerer for det faktum at $ s $ estimerer det sanne standardavviket til populasjonen som x
prøver fra.
Deretter er $ t $ -statistikken
\ begin {align} t = \ frac {\ bar {x} – \ mu_ {0}} {s / \ sqrt {n}} = \ frac {\ bar {x}} {s / \ sqrt {n}}, \ end {align}
fordi $ \ mu_ {0} $ antas å være lik null. Dokumentasjonen sier ikke, så jeg antar at testen er en toveis $ t $ -test, noe som betyr at ttest
returnerer 1 hvis $ t $ er større enn tinv(0.95, length(x))
eller mindre enn tinv(0.05, length(x))
(dette er t-statistikken som tilsvarer et 5% nivå av betydning; det bør være slik at tinv(0.05, length(x))
tilsvarer -tinv(0.95, length(x))
). Ellers returnerer ttest
0.
Kommentarer
- Takk. Kan du si hva som er tinv (igjen ikke veldig klart for meg), og hvordan beregnes p-verdien p i en samtale [h, p] = ttest?
- Eleven ' første fordeling er en sannsynlighetsfordeling med parameteren $ \ nu $ (kalt " grader av frihet ") Hvis x = tinv (0,95, nu), så for en tilfeldig variabel $ t $ med student ' fordeling med $ \ nu $ frihetsgrader, $ P (t < = x) = 0,95 $. Med andre ord er x den 95. persentilen av denne sannsynlighetsfordelingen.
- Eller hvis du foretrekker: ttest returnerer enten 1 eller null. Matrisen eller vektoren som mates til test blir analysert for å fastslå om vektoren kommer fra en populasjon som normalt var fordelt. Eller ikke. Returnering av 1 betyr " ja " (95% KI), null betyr nei. Null kan også bety at vektoren ikke tilfredsstilte antagelsen om at gjennomsnittet var null. Andre argumenter for å teste har forskjellige betydninger. Dette er for H = ttest (x);