Számítsa ki a szórást a minta méretétől, átlagától és konfidencia intervallumától?

Kíváncsi vagyok, vissza tudom-e számolni a szórást az átlagtól, a minta nagyságától és a konfidenciaintervallumtól.

Például: átlagéletkor = 40,2; minta mérete = 427; és 95% -os megbízhatósági intervallum = (38,9–41,5)

És ha igen, alkalmazható-e például a százalékos mértékre, például: a férfi százalék = 64,2%; minta mérete = 427; és 95% -os konfidencia intervallum = (59,4-68,7).

Megjegyzések

  • Ha normál eloszlást feltételezünk, akkor a a konfidencia intervallum szigorúan a minta szórásának függvénye. A többi változó átlagát és mintaméretét megadjuk. Nem tudom, hogy ' mit értesz " százalékos mérték alatt ". Tehát nem tudok ' segíteni ebben.
  • Százalékos mérték alatt egyszerűen azt értettem, hogy a minta 64,2% -a férfi.

Válasz

  • A százalék / arány szórása a következő:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Így százalékos megadás esetén közvetlenül megtalálja az alapértelmezett értéket eltérés.

  • visszakövetéshez , tudjuk, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    95% -nál $ z = 1.96 $ , N = 427, $ p = 0.642 $

    $ \ sigma =? $

Ezért használja a fenti képletet és a hátsó helyettesítőt.

  • Ha a minta mérete kisebb, mint 30 (N < 30) , t-értéket kell használnia Z-érték helyett ( t-érték kalkulátor ). A t-érték szabadságfokokkal rendelkezik $ df = N-1 $ és $ {\ rm prob} = (1- \ alpha) / 2 $ .

Így a képlet: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Megjegyzések

  • Ez a módszer a központi korláttételt és így csak a nagy $ N $ határértékénél pontos.
  • Igazad van, én adtam meg a képletet, mivel a kérdésnek nagy volt a mintamérete > 30. Tehát a CLT már életbe lép. Kisebb mintanagyság esetén a T eloszlást használhatjuk a Z eloszlás helyett, megfelelő szabadságfok mellett.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ alkalmazható Bernoulli eloszlására csak más disztribúciókra nem alkalmazható.

Válasz

Kicsit későn érkeztem a partihoz, de ezt észrevettem a kérdés második részét nem kezelték teljes körűen – “alkalmazható-e százalékos mértékre”?

Az operatív programok megjegyzését követően feltételezem, hogy “százalékos mértékkel” valamilyen bináris eredményre utalunk ( Férfi / Nő, Jobbkezes / Balkezes stb.).

Ebben az esetben a változókat diszkrét valószínűség-eloszlás írja le, míg az életkor folyamatos változó, és folyamatos valószínűség-eloszlás írja le őket. A bináris változók eloszlásának általános választása a binomiális eloszlás. A binomiál bizalmi intervallumai különböző módon konstruálhatók ( wiki ). Az eredeti tanulmánynak meg kellett volna írnia, hogyan vezették le ezeket a konfidencia intervallumokat.

Ne feledje, hogy továbbra is használhatja a user3808268 által megadott képletet a “szórás” megszerzéséhez, de ez nehéz értelmesen értelmezni.

Válasz

A megadott leírásból az első kérdés az emberek életkorának megoszlására vonatkozik. Normál (azaz Gauss ) elosztása az ilyen típusú alkalmazásokra vonatkozik.

Hasznos lehet, ha tudja, hogyan számították ki a konfidencia intervallumot (CI), mert a CI kiszámításának sokféle lehetséges módja van. Például, ha az eloszlás normális eloszlású, és a CI-t t-teszt segítségével számoltuk ki, akkor az SD a következő egyenlettel becsülhető meg:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

ahol a CL a megbízhatósági szint, a „ci_upper” és a „ci_lower” a CI felső és alsó határa, illetve „tinv () “a Student inverz T cdf.

Ellenkező esetben, ha normál eloszlású, de a CI kiszámításához ismert SD-t használtunk, akkor az SD a következő egyenlettel számolható:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh Az ere “erfinv ()” az inverz hibafüggvény.

A második kérdésed az emberek nemének (azazférfi vagy nő). Az Ön által megadott adatokból úgy tűnik, hogy n = 427 teljes minta között k = 274 férfi van. A Bernoulli disztribúció vonatkozik erre az alkalmazásra. Ebben az esetben a variancia (a férfi populációban) = p * (1-p) = 0,2299, és SD = sqrt (0,2299) = 0,4795, ahol p az átlagérték. Vegye figyelembe, hogy " valiance = mean * (1-mean) " csak Bernoulli-disztribúcióra alkalmazható.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük