Zastanawiam się, czy mogę z powrotem obliczyć odchylenie standardowe ze średniej, wielkości próby i przedziału ufności.
Na przykład: średni wiek = 40,2; wielkość próby = 427; i 95% przedział ufności = (38,9-41,5)
A jeśli tak, czy można to zastosować do pomiaru procentowego, na przykład: procent mężczyzn = 64,2%; wielkość próby = 427; i 95% przedział ufności = (59,4-68,7).
Komentarze
- Jeśli zakładasz rozkład normalny, wzór na punkty końcowe przedział ufności jest ściśle funkcją odchylenia standardowego próbki. Podano średnią dla pozostałych zmiennych i wielkość próby. Nie ' nie wiem, co masz na myśli przez " miarę procentową ". Więc nie mogę ' ci w tym pomóc.
- Przez miarę procentową rozumiałem po prostu, że 64,2% próbki to mężczyźni.
Odpowiedź
-
Odchylenie standardowe procentu / proporcji to:
\ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0,642 (1-0,642)} \\ [5pt] & = 0,4792 \ end {align} Zatem gdy podamy wartość procentową, można bezpośrednio znaleźć standardowe odchylenie. -
W przypadku śledzenia wstecznego , wiemy, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $
Dla 95% $ z = 1,96 $ , N = 427, $ p = 0,642 $
$ \ sigma =? $
Zatem użyj powyższego wzoru i podstaw z powrotem.
- Jeśli twój rozmiar próbki jest mniejszy niż 30 (N < 30) , musisz użyć wartości t zamiast wartości Z ( kalkulator wartości t ). Wartość t ma stopnie swobody $ df = N-1 $ i $ {\ rm prob} = (1- \ alpha) / 2 $ .
Zatem wzór jest następujący: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $
Komentarze
- Ta metoda wykorzystuje centralne twierdzenie graniczne i więc jest dokładna tylko w granicach dużych $ N $.
- Masz rację, podałem wzór, ponieważ pytanie miało duży rozmiar próbki > 30. Więc CLT już obowiązuje. W przypadku mniejszej próby możemy użyć rozkładu T zamiast rozkładu Z z odpowiednim stopniem swobody.
- $ \ sigma = \ sqrt (p ∗ (1 − p)) $ ma zastosowanie do rozkładu Bernoulliego tylko, nie dotyczy innych dystrybucji.
Odpowiedź
Trochę za późno na imprezę, ale zauważyłem, że druga część pytania nie została w pełni rozwiązana – „czy można ją zastosować do środka procentowego”?
Po komentarzu do PO zakładam, że przez „miarę procentową” odnosimy się do jakiegoś wyniku binarnego ( Mężczyzna / Kobieta, praworęczny / leworęczny itp.).
W tym przypadku zmienne są opisane dyskretnym rozkładem prawdopodobieństwa, podczas gdy wiek jest zmienną ciągłą i jest opisany ciągłym rozkładem prawdopodobieństwa. Typowym wyborem rozkładu zmiennych binarnych jest rozkład dwumianowy. Przedziały ufności dla dwumianu można konstruować na różne sposoby ( wiki ). Oryginalne badanie powinno opisać, w jaki sposób wyprowadzili te przedziały ufności.
Pamiętaj, że nadal możesz użyć wzoru dostarczonego przez użytkownika3808268, aby uzyskać „odchylenie standardowe”, ale byłoby to trudno go sensownie zinterpretować.
Odpowiedź
Z przedstawionego przez Ciebie opisu pierwsze pytanie dotyczy rozkładu wieku ludzi. Normalny (tj. Gaussian ) dotyczy tego typu aplikacji.
Będzie pomocne, jeśli wiesz, jak obliczono przedział ufności (CI), ponieważ istnieje wiele różnych możliwych sposobów obliczenia CI. Na przykład, jeśli rozkład ma rozkład normalny, a CI obliczono za pomocą testu t, a następnie odchylenie standardowe można oszacować za pomocą następującego równania:
SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),
gdzie CL to poziom ufności, „ci_upper” i „ci_lower” to odpowiednio górna i dolna granica CI, a „tinv () „jest odwrotnością wartości T cdf Studenta.
W przeciwnym razie, jeśli ma rozkład normalny, ale do obliczenia CI użyto znanego odchylenia standardowego, wówczas odchylenie standardowe można obliczyć za pomocą następującego równania:
SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),
wh Ere „erfinv ()” jest odwrotną funkcją błędu.
Twoje drugie pytanie dotyczy rozkładu płci (tj.Mężczyzna czy kobieta). Z podanych danych wynika, że wśród n = 427 całych próbek jest k = 274 samców. Rozkład Bernoulliego dotyczy tej aplikacji. W tym przypadku wariancja (populacji mężczyzn) = p * (1-p) = 0,2299 i SD = sqrt (0,2299) = 0,4795, gdzie p jest wartością średnią. Zwróć uwagę, że " valiance = mean * (1-mean) " ma zastosowanie tylko do dystrybucji Bernoulliego.