Alguém pode esclarecer o que exatamente é produzido pelo comando ttest quando executado em um vetor de números $ a_1, a_2, \ ldots, a_n $? OK para responder em uma forma como “ele produz o valor $ x $ que maximiza $ y $.”
Eu percebi que esta é provavelmente uma pergunta trivial para os especialistas, mas não consigo encontrar facilmente resposta clara.
Resposta
Matlab “s ttest
pega seu vetor de dados e realiza um teste t de Student (uma amostra) nele, assumindo que:
- a população significa que você “testando novamente, $ \ mu_ {0} $, é zero
- $ n $ é igual a
length(x)
- o nível de significância estatística, ou erro Tipo I , você está disposto a aceitar é de 5%; você pode alterar a quantidade de erro Tipo I que está disposto a aceitar em os argumentos da função
O $ t $ -teste calcula a média dos dados em x
(ou seja, $ \ bar {x} = $ sum(x)/length(x)
), e seu desvio padrão da amostra , $ s $, normalmente com a fórmula
\ begin {align} s = \ sqrt {\ frac {1} {n – 1} \ sum_ {i = 1} ^ {n} (x_ {i} – \ bar {x}) ^ {2}}, \ end {align}
que corrige o fato de que $ s $ estima o verdadeiro desvio padrão da população da qual x
faz a amostragem.
Então, a $ t $ -statística é
\ begin {align} t = \ frac {\ bar {x} – \ mu_ {0}} {s / \ sqrt {n}} = \ frac {\ bar {x}} {s / \ sqrt {n}}, \ end {align}
porque $ \ mu_ {0} $ é assumido igual a zero. A documentação não diz, então suponho que o teste seja um $ t $ -teste bidirecional, o que significa que ttest
retorna 1 se $ t $ for maior que tinv(0.95, length(x))
ou inferior a tinv(0.05, length(x))
(estas são as estatísticas t correspondentes a um nível de significância de 5%; deve ser o caso de tinv(0.05, length(x))
é igual a -tinv(0.95, length(x))
). Caso contrário, ttest
retorna 0.
Comentários
- Obrigado. Você pode dizer o que é tinv (novamente, não muito claro para mim) e como o valor p p é calculado em uma chamada [h, p] = ttest?
- A distribuição do aluno ' st é uma distribuição de probabilidade com um parâmetro $ \ nu $ (chamado de " graus de liberdade ") Se x = tinv (0,95, nu), então para uma variável aleatória $ t $ com a distribuição do aluno ' st com $ \ nu $ graus de liberdade, $ P (t < = x) = 0,95 $. Em outras palavras, x é o 95º percentil dessa distribuição de probabilidade.
- Ou se você preferir: ttest retorna 1 ou zero. A matriz ou vetor alimentado para ttest é analisado a fim de verificar se o vetor veio de uma população que estava normalmente distribuída. Ou não. Retorno de 1 significa " sim " (IC de 95%), zero significa não. Zero também pode significar que o vetor não satisfez a suposição de que a média seja zero. Outros argumentos para testar têm significados diferentes. Isso é para H = ttest (x);