Matlab ttest faz o que exatamente?

Matlab ttest “retorna uma decisão de teste para a hipótese nula de que os dados em x vêm de um normal distribuição com média igual a zero e variância desconhecida, usando o teste t de uma amostra. “

Alguém pode esclarecer o que exatamente é produzido pelo comando ttest quando executado em um vetor de números $ a_1, a_2, \ ldots, a_n $? OK para responder em uma forma como “ele produz o valor $ x $ que maximiza $ y $.”

Eu percebi que esta é provavelmente uma pergunta trivial para os especialistas, mas não consigo encontrar facilmente resposta clara.

Resposta

Matlab “s ttest pega seu vetor de dados e realiza um teste t de Student (uma amostra) nele, assumindo que:

  • a população significa que você “testando novamente, $ \ mu_ {0} $, é zero
  • $ n $ é igual a length(x)
  • o nível de significância estatística, ou erro Tipo I , você está disposto a aceitar é de 5%; você pode alterar a quantidade de erro Tipo I que está disposto a aceitar em os argumentos da função

O $ t $ -teste calcula a média dos dados em x (ou seja, $ \ bar {x} = $ sum(x)/length(x)), e seu desvio padrão da amostra , $ s $, normalmente com a fórmula

\ begin {align} s = \ sqrt {\ frac {1} {n – 1} \ sum_ {i = 1} ^ {n} (x_ {i} – \ bar {x}) ^ {2}}, \ end {align}

que corrige o fato de que $ s $ estima o verdadeiro desvio padrão da população da qual x faz a amostragem.

Então, a $ t $ -statística é

\ begin {align} t = \ frac {\ bar {x} – \ mu_ {0}} {s / \ sqrt {n}} = \ frac {\ bar {x}} {s / \ sqrt {n}}, \ end {align}

porque $ \ mu_ {0} $ é assumido igual a zero. A documentação não diz, então suponho que o teste seja um $ t $ -teste bidirecional, o que significa que ttest retorna 1 se $ t $ for maior que tinv(0.95, length(x)) ou inferior a tinv(0.05, length(x)) (estas são as estatísticas t correspondentes a um nível de significância de 5%; deve ser o caso de tinv(0.05, length(x)) é igual a -tinv(0.95, length(x))). Caso contrário, ttest retorna 0.

Comentários

  • Obrigado. Você pode dizer o que é tinv (novamente, não muito claro para mim) e como o valor p p é calculado em uma chamada [h, p] = ttest?
  • A distribuição do aluno ' st é uma distribuição de probabilidade com um parâmetro $ \ nu $ (chamado de " graus de liberdade ") Se x = tinv (0,95, nu), então para uma variável aleatória $ t $ com a distribuição do aluno ' st com $ \ nu $ graus de liberdade, $ P (t < = x) = 0,95 $. Em outras palavras, x é o 95º percentil dessa distribuição de probabilidade.
  • Ou se você preferir: ttest retorna 1 ou zero. A matriz ou vetor alimentado para ttest é analisado a fim de verificar se o vetor veio de uma população que estava normalmente distribuída. Ou não. Retorno de 1 significa " sim " (IC de 95%), zero significa não. Zero também pode significar que o vetor não satisfez a suposição de que a média seja zero. Outros argumentos para testar têm significados diferentes. Isso é para H = ttest (x);

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *