Calcular o desvio padrão do tamanho da amostra, média e intervalo de confiança?

Gostaria de saber se posso calcular novamente o desvio padrão da média, tamanho da amostra e intervalo de confiança.

Por exemplo: idade média = 40,2; tamanho da amostra = 427; e intervalo de confiança de 95% = (38,9-41,5)

E em caso afirmativo, pode ser aplicado à medida de porcentagem, por exemplo: por cento sendo masculino = 64,2%; tamanho da amostra = 427; e intervalo de confiança de 95% = (59,4-68,7).

Comentários

  • Se você está assumindo uma distribuição normal, então a fórmula para os pontos finais do o intervalo de confiança é estritamente uma função do desvio padrão da amostra. As outras variáveis média e tamanho da amostra são dados. Eu não ' não sei o que você quer dizer com " medida percentual ". Portanto, não posso ' ajudá-lo com isso.
  • Por medida de porcentagem, eu simplesmente quis dizer que 64,2% da amostra é do sexo masculino.

Resposta

  • O desvio padrão para porcentagem / proporção é:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0,642 (1-0,642)} \\ [5pt] & = 0,4792 \ end {align} Assim, quando dado uma porcentagem, você pode encontrar diretamente o std desvio.

  • Para rastreamento retroativo , nós sabemos, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Para 95%, $ z = 1,96 $ , N = 427, $ p = 0,642 $

    $ \ sigma =? $

Portanto, use a fórmula acima e o substituto de volta.

  • Se o seu o tamanho da amostra é inferior a 30 (N < 30) , você deve usar um valor t em vez do valor Z ( calculadora do valor t ). O valor t tem graus de liberdade $ df = N-1 $ e $ {\ rm prob} = (1- \ alpha) / 2 $ .

Portanto, a fórmula é: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Comentários

  • Este método usa o teorema do limite central e portanto, só é preciso no limite de $ N $ grandes.
  • Você está correto, dei a fórmula, pois a pergunta tinha um tamanho de amostra grande > 30. Então a CLT já está em vigor. Para tamanhos de amostra menores, podemos usar a distribuição T em vez da distribuição Z com o grau de liberdade apropriado.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ é aplicável à distribuição de Bernoulli apenas, não aplicável a outras distribuições.

Resposta

Um pouco tarde para a festa, mas percebi que a segunda parte da questão não foi totalmente abordada – “pode ser aplicada à medida percentual”?

Seguindo o comentário dos OPs, estou assumindo que por “medida percentual” estamos nos referindo a algum resultado binário Masculino / Feminino, Destro / Canhoto etc.).

Nesse caso, as variáveis são descritas por uma distribuição de probabilidade discreta, enquanto a idade é uma variável contínua e é descrita por uma distribuição de probabilidade contínua. Uma escolha comum para a distribuição de variáveis binárias é a distribuição binomial. Os intervalos de confiança para o binômio podem ser construídos de maneiras diferentes ( wiki ). O estudo original deveria ter descrito como eles derivaram esses intervalos de confiança.

Observe que você ainda pode usar a fórmula fornecida pelo usuário3808268 para obter o “desvio padrão”, mas seria difícil interpretá-lo de forma significativa.

Resposta

Pela descrição que você forneceu, sua primeira pergunta é sobre a distribuição da idade das pessoas. Normal (ou seja, Gaussiana ) distribuição se aplica a esses tipos de aplicativos.

Será útil se você souber como o intervalo de confiança (IC) foi calculado, porque há muitas maneiras diferentes de calcular o IC. Por exemplo, se a distribuição é de distribuição normal e o IC foi calculado usando o teste t, então o SD pode ser estimado com a seguinte equação:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

onde CL é o nível de confiança, ci_upper e ci_lower são os limites superior e inferior de IC respectivamente, e “tinv () “é o inverso do cdf T do aluno”.

Caso contrário, se for de distribuição normal, mas um SD conhecido foi usado no cálculo do IC, então o SD pode ser calculado com a seguinte equação:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh Onde “erfinv ()” é a função de erro inversa.

Sua segunda pergunta é sobre a distribuição do sexo das pessoas (ou seja,masculino ou feminino). A partir dos dados fornecidos, parece que existem k = 274 homens entre n = 427 de amostras inteiras. A distribuição Bernoulli se aplica a este aplicativo. Neste caso, a variância (da população masculina) = p * (1-p) = 0,2299 e SD = sqrt (0,2299) = 0,4795, onde p é o valor médio. Observe que " valiance = mean * (1-mean) " é aplicável apenas à distribuição Bernoulli.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *