Calculați abaterea standard de la dimensiunea eșantionului, media și intervalul de încredere?

Mă întreb dacă pot calcula înapoi abaterea standard de la medie, dimensiunea eșantionului și intervalul de încredere.

De exemplu: vârsta medie = 40,2; mărimea eșantionului = 427; și 95% interval de încredere = (38,9-41,5)

Și dacă da, se poate aplica măsurii procentuale, de exemplu: procentul fiind bărbat = 64,2%; mărimea eșantionului = 427; și 95% interval de încredere = (59.4-68.7).

Comentarii

  • Dacă presupuneți o distribuție normală, atunci formula pentru punctele finale ale intervalul de încredere este strict o funcție a deviației standard a eșantionului. Celelalte variabile media și mărimea eșantionului sunt date. Nu ' nu știu ce vrei să spui prin " măsură procentuală ". Deci, nu vă pot ' să vă ajut în acest sens.
  • Prin măsurătoare procentuală am înțeles pur și simplu că 64,2% din eșantion este de sex masculin.

Răspuns

  • Abaterea standard pentru procent / proporție este:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Astfel, atunci când vi se oferă un procent, puteți găsi direct std deviere.

  • Pentru urmărire înapoi , știm, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Pentru 95%, $ z = 1.96 $ , N = 427, $ p = 0.642 $

    $ \ sigma =? $

Utilizați astfel formula de mai sus și înlocuiți înapoi.

  • Dacă dimensiunea eșantionului este mai mică de 30 (N < 30) , trebuie să utilizați o valoare t în loc de valoare Z ( calculator valoare t ). Valoarea t are grade de libertate $ df = N-1 $ și $ {\ rm prob} = (1- \ alpha) / 2 $ .

Astfel formula este: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Comentarii

  • Această metodă utilizează teorema limitei centrale și deci este corect doar în limita de $ N $ mari.
  • Aveți dreptate, am dat formula, deoarece întrebarea avea dimensiunea eșantionului mare > 30. Deci CLT este deja în vigoare. Pentru dimensiuni mai mici ale eșantionului, putem utiliza distribuția T în loc de distribuția Z cu un grad de libertate adecvat.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ se aplică distribuției Bernoulli numai, nu se aplică altor distribuții.

Răspuns

Cam târziu la petrecere, dar am observat că a doua parte a întrebării nu a fost complet abordată – „se poate aplica măsurii procentuale”?

În urma comentariului programelor operaționale, presupun că prin „măsură procentuală” ne referim la unele rezultate binare ( Bărbat / Femeie, Dreptaci / Stângaci etc.).

În acest caz, variabilele sunt descrise printr-o distribuție discretă de probabilitate, în timp ce vârsta este o variabilă continuă și este descrisă printr-o distribuție continuă de probabilitate. O alegere comună pentru distribuția variabilelor binare este distribuția binomială. Intervalele de încredere pentru binom pot fi construite în moduri diferite ( wiki ). Studiul inițial ar fi trebuit să descrie modul în care au derivat acele intervale de încredere.

Rețineți că puteți utiliza în continuare formula furnizată de user3808268 pentru a obține „abaterea standard”, dar ar fi dificil de interpretat cu sens.

Răspuns

Din descrierea pe care ați furnizat-o, prima dvs. întrebare este despre distribuția vârstei oamenilor. Normal (adică Gaussian ) distribuția se aplică pentru astfel de aplicații.

Va fi util dacă știți cum a fost calculat intervalul de încredere (CI), deoarece există multe modalități diferite de calculare a CI. De exemplu, dacă distribuția este de distribuție normală, iar CI a fost calculat utilizând testul t, apoi SD poate fi estimat cu următoarea ecuație:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

unde CL este nivelul de încredere, „ci_upper” și „ci_lower” sunt limitele superioare și inferioare ale CI, respectiv „tinv () „este inversul lui T cdf al Studentului.

În caz contrar, dacă este de distribuție normală, dar s-a folosit un SD cunoscut în calcularea CI, atunci SD poate fi calculat cu următoarea ecuație:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh Ancă „erfinv ()” este funcția de eroare inversă.

A doua întrebare este despre distribuția sexului oamenilor (de exemplu,bărbat sau femeie). Din datele pe care le-ați furnizat, se pare că există k = 274 bărbați dintre n = 427 din eșantioane întregi. Distribuția Bernoulli se aplică acestei aplicații. În acest caz, varianța (populației masculine) = p * (1-p) = 0,2299 și SD = sqrt (0,2299) = 0,4795, unde p este valoarea medie. Rețineți că " valiance = mean * (1-mean) " se aplică numai distribuției Bernoulli.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *