Standardabweichung von Stichprobengröße, Mittelwert und Konfidenzintervall berechnen?

Ich frage mich, ob ich die Standardabweichung von Mittelwert, Stichprobengröße und Konfidenzintervall zurückrechnen kann.

Zum Beispiel: Durchschnittsalter = 40,2; Stichprobengröße = 427; und 95% -Konfidenzintervall = (38,9-41,5)

Und wenn ja, kann es auf das prozentuale Maß angewendet werden, zum Beispiel: Prozent ist männlich = 64,2%; Stichprobengröße = 427; und 95% Konfidenzintervall = (59,4-68,7).

Kommentare

  • Wenn Sie eine Normalverteilung annehmen, dann die Formel für die Endpunkte der Das Konfidenzintervall ist streng eine Funktion der Standardabweichung der Stichprobe. Die anderen Variablen Mittelwert und Stichprobengröße sind angegeben. Ich ' weiß nicht, was Sie mit " Prozentmaß " meinen. Daher kann ich ' Ihnen dabei nicht helfen.
  • Mit Prozentmaß meinte ich einfach, dass 64,2% der Stichprobe männlich sind.

Antwort

  • Die Standardabweichung für Prozentsatz / Anteil lautet:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Wenn Sie also einen Prozentsatz angeben, können Sie den Standard direkt finden Abweichung.

  • Für Rückverfolgung wissen wir, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Für 95% ist $ z = 1,96 $ , N = 427, $ p = 0,642 $

    $ \ sigma =? $

Verwenden Sie daher die obige Formel und ersetzen Sie sie.

  • Wenn Ihr Stichprobengröße ist kleiner als 30 (N < 30) , Sie müssen einen t-Wert verwenden anstelle des Z-Werts ( T-Wert-Rechner ). Der t-Wert hat Freiheitsgrade $ df = N-1 $ und $ {\ rm prob} = (1- \ alpha) / 2 $ .

Die Formel lautet also: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Kommentare

  • Diese Methode verwendet den zentralen Grenzwertsatz und Dies ist nur in der Grenze von $ N $ genau.
  • Sie haben Recht, ich habe die Formel angegeben, da die Frage eine große Stichprobengröße hatte. > 30. Also Das CLT ist bereits in Kraft. Für kleinere Stichproben können wir die T-Verteilung anstelle der Z-Verteilung mit angemessenem Freiheitsgrad verwenden.
  • $ \ sigma = \ sqrt (p ∗ (1 – p)) $ gilt für die Bernoulli-Verteilung Nur nicht anwendbar auf andere Distributionen.

Antwort

Ein bisschen spät zur Party, aber das habe ich bemerkt Der zweite Teil der Frage wurde nicht vollständig angesprochen – „Kann er auf ein prozentuales Maß angewendet werden?“

Nach dem Kommentar des OP gehe ich davon aus, dass wir uns mit „prozentualem Maß“ auf ein binäres Ergebnis beziehen ( Männlich / weiblich, rechtshändig / linkshändig usw.).

In diesem Fall werden die Variablen durch eine diskrete Wahrscheinlichkeitsverteilung beschrieben, während das Alter eine kontinuierliche Variable ist und durch eine kontinuierliche Wahrscheinlichkeitsverteilung beschrieben wird. Eine übliche Wahl für die Verteilung von Binärvariablen ist die Binomialverteilung. Konfidenzintervalle für das Binom können auf verschiedene Arten erstellt werden ( wiki ). In der ursprünglichen Studie sollte beschrieben worden sein, wie diese Konfidenzintervalle abgeleitet wurden.

Beachten Sie, dass Sie weiterhin die von user3808268 bereitgestellte Formel verwenden können, um die „Standardabweichung“ zu erhalten, dies wäre jedoch der Fall schwer sinnvoll zu interpretieren.

Antwort

Nach der von Ihnen angegebenen Beschreibung bezieht sich Ihre erste Frage auf die Verteilung des Alters der Personen. Normal (dh Gaußsch ) Die Verteilung gilt für solche Anwendungen.

Es ist hilfreich, wenn Sie wissen, wie das Konfidenzintervall (CI) berechnet wurde, da es viele verschiedene Möglichkeiten gibt, das CI zu berechnen. Zum Beispiel, wenn Die Verteilung ist normalverteilt, und der CI wurde unter Verwendung des t-Tests berechnet. Dann kann die SD mit der folgenden Gleichung geschätzt werden:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

wobei CL das Konfidenzniveau ist, sind ci_upper und ci_lower die oberen bzw. unteren Grenzen von CI und „tinv () „ist die Umkehrung von Students T cdf.

Andernfalls kann die SD mit der folgenden Gleichung berechnet werden, wenn sie normalverteilt ist, aber eine bekannte SD zur Berechnung des CI verwendet wurde:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh bevor „erfinv ()“ die inverse Fehlerfunktion ist.

Ihre zweite Frage betrifft die Verteilung des Geschlechts von Personen (d. h.männlich oder weiblich). Aus den von Ihnen angegebenen Daten geht hervor, dass sich unter n = 427 der gesamten Stichproben k = 274 Männer befinden. Für diese Anwendung gilt die Bernoulli-Verteilung. In diesem Fall ist die Varianz (der männlichen Bevölkerung) = p * (1-p) = 0,2299 und SD = sqrt (0,2299) = 0,4795, wobei p der Mittelwert ist. Beachten Sie, dass " valiance = mean * (1-mean) " gilt nur für die Bernoulli-Verteilung.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.