Calculer lécart type à partir de la taille de léchantillon, de la moyenne et de lintervalle de confiance?

Je me demande si je peux recalculer lécart type à partir de la moyenne, de la taille de léchantillon et de lintervalle de confiance.

Par exemple: âge moyen = 40,2; taille de léchantillon = 427; et intervalle de confiance à 95% = (38,9-41,5)

Et si oui, peut-il être appliqué à une mesure en pourcentage, par exemple: pourcentage étant un homme = 64,2%; taille de léchantillon = 427; et intervalle de confiance à 95% = (59,4-68,7).

Commentaires

  • Si vous supposez une distribution normale, alors la formule pour les points dextrémité du lintervalle de confiance est strictement fonction de lécart type de léchantillon. La moyenne des autres variables et la taille de léchantillon sont données. Je ne ' ne sais pas ce que vous entendez par " mesure du pourcentage ". Je ne peux donc ' vous aider avec cela.
  • Par mesure de pourcentage, je voulais simplement dire que 64,2% de léchantillon étaient des hommes.

Réponse

  • Lécart type pour le pourcentage / proportion est:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Ainsi, lorsquon lui donne un pourcentage, vous pouvez directement trouver le std déviation.

  • Pour suivi arrière , nous savons, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Pour 95%, $ z = 1,96 $ , N = 427, $ p = 0,642 $

    $ \ sigma =? $

Utilisez donc la formule ci-dessus et le substitut arrière.

  • Si votre la taille de léchantillon est inférieure à 30 (N < 30) , vous devez utiliser une valeur t au lieu de la valeur Z ( calculatrice de valeur t ). La valeur t a des degrés de liberté $ df = N-1 $ et $ {\ rm prob} = (1- \ alpha) / 2 $ .

Ainsi la formule est: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Commentaires

  • Cette méthode utilise le théorème de limite central et donc nest précis que dans la limite de gros $ N $.
  • Vous avez raison, jai donné la formule puisque la question avait une grande taille déchantillon > 30. Donc le CLT est déjà en vigueur. Pour une taille déchantillon plus petite, nous pouvons utiliser la distribution T au lieu de la distribution Z avec un degré de liberté approprié.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ est applicable à la distribution de Bernoulli uniquement, non applicable aux autres distributions.

Réponse

Un peu en retard à la fête, mais jai remarqué que la deuxième partie de la question na pas été entièrement traitée – « peut-elle sappliquer à une mesure en pourcentage »?

Suite au commentaire des PO, je suppose que par « mesure en pourcentage », nous faisons référence à un résultat binaire ( Homme / Femme, Droitier / Gaucher etc.).

Dans ce cas, les variables sont décrites par une distribution de probabilité discrète, tandis que lâge est une variable continue et est décrit par une distribution de probabilité continue. Un choix courant pour la distribution des variables binaires est la distribution binomiale. Les intervalles de confiance pour le binôme peuvent être construits de différentes manières ( wiki ). Létude originale aurait dû décrire comment ils ont dérivé ces intervalles de confiance.

Notez que vous pouvez toujours utiliser la formule fournie par user3808268 pour obtenir «lécart type», mais ce serait difficile de linterpréter de manière significative.

Réponse

Daprès la description que vous avez fournie, votre première question porte sur la répartition de lâge des personnes. Normal (c.-à-d. gaussien ) sapplique à ce type dapplications.

Il sera utile de savoir comment lintervalle de confiance (IC) a été calculé, car il existe de nombreuses façons différentes de calculer lIC. Par exemple, si la distribution est de distribution normale, et lIC a été calculé en utilisant le test t, alors lécart-type peut être estimé avec léquation suivante:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

où CL est le niveau de confiance, ci_upper et ci_lower sont respectivement les limites supérieure et inférieure de CI, et « tinv () « est linverse de T cdf de Student.

Sinon, sil est de distribution normale, mais quun écart-type connu a été utilisé dans le calcul de lIC, alors lécart-type peut être calculé avec léquation suivante:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh ere « erfinv () » est la fonction derreur inverse.

Votre deuxième question concerne la distribution du sexe des personnes (c.-à-d.masculin ou féminin). Daprès les données que vous avez fournies, il semble quil y ait k = 274 hommes parmi n = 427 déchantillons entiers. La distribution Bernoulli sapplique à cette application. Dans ce cas, la variance (de la population masculine) = p * (1-p) = 0,2299 et SD = sqrt (0,2299) = 0,4795, où p est la valeur moyenne. Notez que " valiance = mean * (1-mean) " sapplique uniquement à la distribution de Bernoulli.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *