Mă întreb dacă pot calcula înapoi abaterea standard de la medie, dimensiunea eșantionului și intervalul de încredere.
De exemplu: vârsta medie = 40,2; mărimea eșantionului = 427; și 95% interval de încredere = (38,9-41,5)
Și dacă da, se poate aplica măsurii procentuale, de exemplu: procentul fiind bărbat = 64,2%; mărimea eșantionului = 427; și 95% interval de încredere = (59.4-68.7).
Comentarii
- Dacă presupuneți o distribuție normală, atunci formula pentru punctele finale ale intervalul de încredere este strict o funcție a deviației standard a eșantionului. Celelalte variabile media și mărimea eșantionului sunt date. Nu ' nu știu ce vrei să spui prin " măsură procentuală ". Deci, nu vă pot ' să vă ajut în acest sens.
- Prin măsurătoare procentuală am înțeles pur și simplu că 64,2% din eșantion este de sex masculin.
Răspuns
-
Abaterea standard pentru procent / proporție este:
\ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Astfel, atunci când vi se oferă un procent, puteți găsi direct std deviere. -
Pentru urmărire înapoi , știm, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $
Pentru 95%, $ z = 1.96 $ , N = 427, $ p = 0.642 $
$ \ sigma =? $
Utilizați astfel formula de mai sus și înlocuiți înapoi.
- Dacă dimensiunea eșantionului este mai mică de 30 (N < 30) , trebuie să utilizați o valoare t în loc de valoare Z ( calculator valoare t ). Valoarea t are grade de libertate $ df = N-1 $ și $ {\ rm prob} = (1- \ alpha) / 2 $ .
Astfel formula este: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $
Comentarii
- Această metodă utilizează teorema limitei centrale și deci este corect doar în limita de $ N $ mari.
- Aveți dreptate, am dat formula, deoarece întrebarea avea dimensiunea eșantionului mare > 30. Deci CLT este deja în vigoare. Pentru dimensiuni mai mici ale eșantionului, putem utiliza distribuția T în loc de distribuția Z cu un grad de libertate adecvat.
- $ \ sigma = \ sqrt (p ∗ (1 − p)) $ se aplică distribuției Bernoulli numai, nu se aplică altor distribuții.
Răspuns
Cam târziu la petrecere, dar am observat că a doua parte a întrebării nu a fost complet abordată – „se poate aplica măsurii procentuale”?
În urma comentariului programelor operaționale, presupun că prin „măsură procentuală” ne referim la unele rezultate binare ( Bărbat / Femeie, Dreptaci / Stângaci etc.).
În acest caz, variabilele sunt descrise printr-o distribuție discretă de probabilitate, în timp ce vârsta este o variabilă continuă și este descrisă printr-o distribuție continuă de probabilitate. O alegere comună pentru distribuția variabilelor binare este distribuția binomială. Intervalele de încredere pentru binom pot fi construite în moduri diferite ( wiki ). Studiul inițial ar fi trebuit să descrie modul în care au derivat acele intervale de încredere.
Rețineți că puteți utiliza în continuare formula furnizată de user3808268 pentru a obține „abaterea standard”, dar ar fi dificil de interpretat cu sens.
Răspuns
Din descrierea pe care ați furnizat-o, prima dvs. întrebare este despre distribuția vârstei oamenilor. Normal (adică Gaussian ) distribuția se aplică pentru astfel de aplicații.
Va fi util dacă știți cum a fost calculat intervalul de încredere (CI), deoarece există multe modalități diferite de calculare a CI. De exemplu, dacă distribuția este de distribuție normală, iar CI a fost calculat utilizând testul t, apoi SD poate fi estimat cu următoarea ecuație:
SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),
unde CL este nivelul de încredere, „ci_upper” și „ci_lower” sunt limitele superioare și inferioare ale CI, respectiv „tinv () „este inversul lui T cdf al Studentului.
În caz contrar, dacă este de distribuție normală, dar s-a folosit un SD cunoscut în calcularea CI, atunci SD poate fi calculat cu următoarea ecuație:
SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),
wh Ancă „erfinv ()” este funcția de eroare inversă.
A doua întrebare este despre distribuția sexului oamenilor (de exemplu,bărbat sau femeie). Din datele pe care le-ați furnizat, se pare că există k = 274 bărbați dintre n = 427 din eșantioane întregi. Distribuția Bernoulli se aplică acestei aplicații. În acest caz, varianța (populației masculine) = p * (1-p) = 0,2299 și SD = sqrt (0,2299) = 0,4795, unde p este valoarea medie. Rețineți că " valiance = mean * (1-mean) " se aplică numai distribuției Bernoulli.