Kan någon klargöra exakt vad som matas ut med kommandot ttest när det körs på en vektor med siffror $ a_1, a_2, \ ldots, a_n $? OK att svara i en form som ”det matar ut värdet $ x $ som maximerar $ y $.”
Jag inser att detta förmodligen är en trivial fråga för experterna, men jag kan inte lätt hitta en tydligt svar.
Svar
Matlab ”s ttest
tar din datavektor och utför ett Studenttest (ett prov) t-test på det, förutsatt att:
- befolkningen menar dig ”testar mot, $ \ mu_ {0} $, är noll
- $ n $ är lika med
length(x)
- nivån på statistisk signficance, eller Typ I-fel , du är villig att acceptera är 5%; du kan ändra mängden typ I-fel som du vill acceptera i funktionens argument
$ t $ -test beräknar medelvärdet av data i x
(dvs. $ \ bar {x} = $ sum(x)/length(x)
) och dess standardavvikelse , $ s $, vanligtvis med formeln
\ börja {align} s = \ sqrt {\ frac {1} {n – 1} \ sum_ {i = 1} ^ {n} (x_ {i} – \ bar {x}) ^ {2}}, \ slut {align}
vilket korrigerar för det faktum att $ s $ uppskattar den verkliga standardavvikelsen för befolkningen från vilken x
samplar.
Sedan är $ t $ -statistiken
\ begin {align} t = \ frac {\ bar {x} – \ mu_ {0}} {s / \ sqrt {n}} = \ frac {\ bar {x}} {s / \ sqrt {n}}, \ end {align}
eftersom $ \ mu_ {0} $ antas vara lika med noll. Dokumentationen säger inte, så jag antar att testet är en dubbelriktad $ t $ -test, vilket innebär att ttest
returnerar 1 om $ t $ är större än tinv(0.95, length(x))
eller mindre än tinv(0.05, length(x))
(det här är t-statistiken som motsvarar en 5% betydelse; det borde vara så att tinv(0.05, length(x))
är lika med -tinv(0.95, length(x))
). Annars returnerar ttest
0.
Kommentarer
- Tack. Kan du säga vad som är tinv (återigen inte väldigt klart för mig), och hur beräknas p-värdet p i ett samtal [h, p] = ttest?
- Studenten ' första fördelningen är en sannolikhetsfördelning med en parameter $ \ nu $ (kallas " grader av frihet ") Om x = tinv (0.95, nu), då för en slumpmässig variabel $ t $ med studenten ' st distribution med $ \ nu $ frihetsgrader, $ P (t < = x) = 0,95 $. Med andra ord är x den 95: e percentilen för denna sannolikhetsfördelning.
- Eller om du föredrar: ttest returnerar antingen 1 eller noll. Matrisen eller vektorn som matas till test testas för att fastställa om vektorn kommer från en population som normalt distribuerades. Eller inte. Avkastning av 1 betyder " ja " (95% KI), noll betyder nej. Noll kan också betyda att vektorn inte uppfyllde antagandet att medelvärdet var noll. Andra argument att testa har olika betydelser. Detta är för H = ttest (x);