Kíváncsi vagyok, vissza tudom-e számolni a szórást az átlagtól, a minta nagyságától és a konfidenciaintervallumtól.
Például: átlagéletkor = 40,2; minta mérete = 427; és 95% -os megbízhatósági intervallum = (38,9–41,5)
És ha igen, alkalmazható-e például a százalékos mértékre, például: a férfi százalék = 64,2%; minta mérete = 427; és 95% -os konfidencia intervallum = (59,4-68,7).
Megjegyzések
- Ha normál eloszlást feltételezünk, akkor a a konfidencia intervallum szigorúan a minta szórásának függvénye. A többi változó átlagát és mintaméretét megadjuk. Nem tudom, hogy ' mit értesz " százalékos mérték alatt ". Tehát nem tudok ' segíteni ebben.
- Százalékos mérték alatt egyszerűen azt értettem, hogy a minta 64,2% -a férfi.
Válasz
-
A százalék / arány szórása a következő:
\ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Így százalékos megadás esetén közvetlenül megtalálja az alapértelmezett értéket eltérés. -
visszakövetéshez , tudjuk, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $
95% -nál $ z = 1.96 $ , N = 427, $ p = 0.642 $
$ \ sigma =? $
Ezért használja a fenti képletet és a hátsó helyettesítőt.
- Ha a minta mérete kisebb, mint 30 (N < 30) , t-értéket kell használnia Z-érték helyett ( t-érték kalkulátor ). A t-érték szabadságfokokkal rendelkezik $ df = N-1 $ és $ {\ rm prob} = (1- \ alpha) / 2 $ .
Így a képlet: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $
Megjegyzések
- Ez a módszer a központi korláttételt és így csak a nagy $ N $ határértékénél pontos.
- Igazad van, én adtam meg a képletet, mivel a kérdésnek nagy volt a mintamérete > 30. Tehát a CLT már életbe lép. Kisebb mintanagyság esetén a T eloszlást használhatjuk a Z eloszlás helyett, megfelelő szabadságfok mellett.
- $ \ sigma = \ sqrt (p ∗ (1 − p)) $ alkalmazható Bernoulli eloszlására csak más disztribúciókra nem alkalmazható.
Válasz
Kicsit későn érkeztem a partihoz, de ezt észrevettem a kérdés második részét nem kezelték teljes körűen – “alkalmazható-e százalékos mértékre”?
Az operatív programok megjegyzését követően feltételezem, hogy “százalékos mértékkel” valamilyen bináris eredményre utalunk ( Férfi / Nő, Jobbkezes / Balkezes stb.).
Ebben az esetben a változókat diszkrét valószínűség-eloszlás írja le, míg az életkor folyamatos változó, és folyamatos valószínűség-eloszlás írja le őket. A bináris változók eloszlásának általános választása a binomiális eloszlás. A binomiál bizalmi intervallumai különböző módon konstruálhatók ( wiki ). Az eredeti tanulmánynak meg kellett volna írnia, hogyan vezették le ezeket a konfidencia intervallumokat.
Ne feledje, hogy továbbra is használhatja a user3808268 által megadott képletet a “szórás” megszerzéséhez, de ez nehéz értelmesen értelmezni.
Válasz
A megadott leírásból az első kérdés az emberek életkorának megoszlására vonatkozik. Normál (azaz Gauss ) elosztása az ilyen típusú alkalmazásokra vonatkozik.
Hasznos lehet, ha tudja, hogyan számították ki a konfidencia intervallumot (CI), mert a CI kiszámításának sokféle lehetséges módja van. Például, ha az eloszlás normális eloszlású, és a CI-t t-teszt segítségével számoltuk ki, akkor az SD a következő egyenlettel becsülhető meg:
SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),
ahol a CL a megbízhatósági szint, a „ci_upper” és a „ci_lower” a CI felső és alsó határa, illetve „tinv () “a Student inverz T cdf.
Ellenkező esetben, ha normál eloszlású, de a CI kiszámításához ismert SD-t használtunk, akkor az SD a következő egyenlettel számolható:
SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),
wh Az ere “erfinv ()” az inverz hibafüggvény.
A második kérdésed az emberek nemének (azazférfi vagy nő). Az Ön által megadott adatokból úgy tűnik, hogy n = 427 teljes minta között k = 274 férfi van. A Bernoulli disztribúció vonatkozik erre az alkalmazásra. Ebben az esetben a variancia (a férfi populációban) = p * (1-p) = 0,2299, és SD = sqrt (0,2299) = 0,4795, ahol p az átlagérték. Vegye figyelembe, hogy " valiance = mean * (1-mean) " csak Bernoulli-disztribúcióra alkalmazható.