Obliczyć odchylenie standardowe na podstawie wielkości próby, średniej i przedziału ufności?

Zastanawiam się, czy mogę z powrotem obliczyć odchylenie standardowe ze średniej, wielkości próby i przedziału ufności.

Na przykład: średni wiek = 40,2; wielkość próby = 427; i 95% przedział ufności = (38,9-41,5)

A jeśli tak, czy można to zastosować do pomiaru procentowego, na przykład: procent mężczyzn = 64,2%; wielkość próby = 427; i 95% przedział ufności = (59,4-68,7).

Komentarze

  • Jeśli zakładasz rozkład normalny, wzór na punkty końcowe przedział ufności jest ściśle funkcją odchylenia standardowego próbki. Podano średnią dla pozostałych zmiennych i wielkość próby. Nie ' nie wiem, co masz na myśli przez " miarę procentową ". Więc nie mogę ' ci w tym pomóc.
  • Przez miarę procentową rozumiałem po prostu, że 64,2% próbki to mężczyźni.

Odpowiedź

  • Odchylenie standardowe procentu / proporcji to:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0,642 (1-0,642)} \\ [5pt] & = 0,4792 \ end {align} Zatem gdy podamy wartość procentową, można bezpośrednio znaleźć standardowe odchylenie.

  • W przypadku śledzenia wstecznego , wiemy, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Dla 95% $ z = 1,96 $ , N = 427, $ p = 0,642 $

    $ \ sigma =? $

Zatem użyj powyższego wzoru i podstaw z powrotem.

  • Jeśli twój rozmiar próbki jest mniejszy niż 30 (N < 30) , musisz użyć wartości t zamiast wartości Z ( kalkulator wartości t ). Wartość t ma stopnie swobody $ df = N-1 $ i $ {\ rm prob} = (1- \ alpha) / 2 $ .

Zatem wzór jest następujący: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Komentarze

  • Ta metoda wykorzystuje centralne twierdzenie graniczne i więc jest dokładna tylko w granicach dużych $ N $.
  • Masz rację, podałem wzór, ponieważ pytanie miało duży rozmiar próbki > 30. Więc CLT już obowiązuje. W przypadku mniejszej próby możemy użyć rozkładu T zamiast rozkładu Z z odpowiednim stopniem swobody.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ ma zastosowanie do rozkładu Bernoulliego tylko, nie dotyczy innych dystrybucji.

Odpowiedź

Trochę za późno na imprezę, ale zauważyłem, że druga część pytania nie została w pełni rozwiązana – „czy można ją zastosować do środka procentowego”?

Po komentarzu do PO zakładam, że przez „miarę procentową” odnosimy się do jakiegoś wyniku binarnego ( Mężczyzna / Kobieta, praworęczny / leworęczny itp.).

W tym przypadku zmienne są opisane dyskretnym rozkładem prawdopodobieństwa, podczas gdy wiek jest zmienną ciągłą i jest opisany ciągłym rozkładem prawdopodobieństwa. Typowym wyborem rozkładu zmiennych binarnych jest rozkład dwumianowy. Przedziały ufności dla dwumianu można konstruować na różne sposoby ( wiki ). Oryginalne badanie powinno opisać, w jaki sposób wyprowadzili te przedziały ufności.

Pamiętaj, że nadal możesz użyć wzoru dostarczonego przez użytkownika3808268, aby uzyskać „odchylenie standardowe”, ale byłoby to trudno go sensownie zinterpretować.

Odpowiedź

Z przedstawionego przez Ciebie opisu pierwsze pytanie dotyczy rozkładu wieku ludzi. Normalny (tj. Gaussian ) dotyczy tego typu aplikacji.

Będzie pomocne, jeśli wiesz, jak obliczono przedział ufności (CI), ponieważ istnieje wiele różnych możliwych sposobów obliczenia CI. Na przykład, jeśli rozkład ma rozkład normalny, a CI obliczono za pomocą testu t, a następnie odchylenie standardowe można oszacować za pomocą następującego równania:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

gdzie CL to poziom ufności, „ci_upper” i „ci_lower” to odpowiednio górna i dolna granica CI, a „tinv () „jest odwrotnością wartości T cdf Studenta.

W przeciwnym razie, jeśli ma rozkład normalny, ale do obliczenia CI użyto znanego odchylenia standardowego, wówczas odchylenie standardowe można obliczyć za pomocą następującego równania:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh Ere „erfinv ()” jest odwrotną funkcją błędu.

Twoje drugie pytanie dotyczy rozkładu płci (tj.Mężczyzna czy kobieta). Z podanych danych wynika, że wśród n = 427 całych próbek jest k = 274 samców. Rozkład Bernoulliego dotyczy tej aplikacji. W tym przypadku wariancja (populacji mężczyzn) = p * (1-p) = 0,2299 i SD = sqrt (0,2299) = 0,4795, gdzie p jest wartością średnią. Zwróć uwagę, że " valiance = mean * (1-mean) " ma zastosowanie tylko do dystrybucji Bernoulliego.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *