Laske keskihajonta otoksen koosta, keskiarvosta ja luottamusvälistä?

Mietin, voinko laskea takaisin keskihajonnan keskiarvosta, otoksen koosta ja luottamusvälistä.

Esimerkiksi: keski-ikä = 40,2; näytteen koko = 427; ja 95%: n luottamusväli = (38,9-41,5)

Ja jos on, voiko sitä soveltaa prosenttimittaan, esimerkiksi: prosenttiosuus miehenä = 64,2%; näytteen koko = 427; ja 95%: n luottamusväli = (59,4-68,7).

Kommentit

  • Jos olet olet normaalijakauman, niin kaavan päätepisteille luottamusväli on tiukasti otoksen keskihajonnan funktio. Muut muuttujien keskiarvo ja otoskoko annetaan. En tiedä ' en tiedä mitä tarkoitat " prosenttilukulla ". Joten en voi ' auttaa sinua siinä.
  • Prosenttiosuusmitalla tarkoitin yksinkertaisesti 64,2%: n näytteen olevan miespuolinen.

vastaus

  • Prosentuaalisen / osuuden keskihajonta on:
    \ begin {tasaus} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {tasaus} Siten kun annat prosenttiosuuden, voit löytää vakion suoraan poikkeama.

  • takaisinseurannalle , tiedämme, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    95%: lle $ z = 1.96 $ , N = 427, $ p = 0.642 $

    $ \ sigma =? $

Käytä siis yllä olevaa kaavaa ja takakorvaa.

  • Jos otoskoko on alle 30 (N < 30) , sinun on käytettävä t-arvoa Z-arvon sijaan ( t-arvon laskin ). T-arvolla on vapausasteita $ df = N-1 $ ja $ {\ rm prob} = (1- \ alpha) / 2 $ .

Siksi kaava on: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

kommentit

  • Tämä menetelmä käyttää keskeistä rajalausetta ja joten se on tarkka vain suurten $ N $: n rajalla.
  • Olet oikeassa, annoin kaavan, koska kysymyksellä oli suuri otoskoko > 30. Joten CLT on jo voimassa. Pienemmässä otoskokossa voimme käyttää T-jakaumaa Z-jakauman sijasta sopivalla vapausasteella.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ soveltuu Bernoullin jakeluun vain, ei koske muita jakeluja.

Vastaa

Hieman myöhässä juhliin, mutta huomasin sen kysymyksen toista osaa ei käsitelty täysin – ”voidaanko sitä soveltaa prosenttimittaan”?

Toimenpideohjelmien kommentin jälkeen oletan, että ”prosenttimittana” tarkoitamme joitakin binäärituloksia ( Mies / Nainen, Oikeakätinen / Vasenkätinen jne.).

Tällöin muuttujia kuvaa erillinen todennäköisyysjakauma, kun taas ikä on jatkuva muuttuja ja sitä kuvaa jatkuva todennäköisyysjakauma. Binaarimuuttujien jakauman yleinen valinta on binomi jakauma. Binomiaalin luotettavuusvälit voidaan rakentaa eri tavoin ( wiki ). Alkuperäisessä tutkimuksessa olisi pitänyt kuvata, miten ne tulivat luottamusvälit.

Huomaa, että voit silti käyttää käyttäjän 38808268 antamaa kaavaa saadaksesi ”keskihajonnan”, mutta se olisi sitä on vaikea tulkita mielekkäästi.

vastaus

Antamastasi kuvauksesta ensimmäinen kysymyksesi koskee ihmisten ikäjakaumaa. Normaali (eli Gaussin ) jakelu koskee tällaisia sovelluksia.

On hyödyllistä, jos tiedät kuinka luottamusväli (CI) laskettiin, koska CI on laskettu monilla eri tavoilla. Esimerkiksi jos jakauma on normaalijakauma ja CI laskettiin t-testin avulla, SD voidaan arvioida seuraavalla yhtälöllä:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

missä CL on luotettavuustaso, ci_upper ja ci_lower ovat CI: n ylä- ja alarajat ja ”tinv” () ”on käänteinen opiskelijan” T cdf.

Jos muuten normaalijakauma on, mutta CI: n laskennassa käytettiin tunnettua SD: tä, SD voidaan laskea seuraavalla yhtälöllä:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh ere ”erfinv ()” on käänteisvirhetoiminto.

Toinen kysymyksesi koskee ihmisten sukupuolen jakaumaa (ts.mies vai nainen). Antamiesi tietojen perusteella kuulostaa siltä, että n = 427 kokonaisen näytteen joukossa on k = 274 miestä. Bernoulli-jakelu koskee tätä sovellusta. Tässä tapauksessa varianssi (miesten populaatiosta) = p * (1-p) = 0,2299 ja SD = sqrt (0,2299) = 0,4795, missä p on keskiarvo. Huomaa, että " valiance = mean * (1-mean) " soveltuu vain Bernoullin jakeluun.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *