平均、サンプルサイズ、信頼区間からの標準偏差を逆算できるかどうか疑問に思います。
例:平均年齢= 40.2;サンプルサイズ= 427;および95%信頼区間=(38.9-41.5)
その場合、パーセンテージ測定に適用できますか。たとえば、次のようになります。パーセントが男性= 64.2%。サンプルサイズ= 427;および95%信頼区間=(59.4-68.7)。
コメント
- 正規分布を想定している場合、のエンドポイントの式信頼区間は厳密にはサンプルの標準偏差の関数です。他の変数の平均とサンプルサイズが示されています。 ' "パーセンテージ測定値"の意味がわかりません。ですから、'それについてはお手伝いできません。
- パーセンテージの測定では、サンプルの64.2%が男性であることを意味します。
回答
-
パーセンテージ/比率の標準偏差は次のとおりです。
\ begin {align} \ sigma & = \ sqrt {p(1-p)} \\ [5pt] & = \ sqrt {0.642(1-0.642)} \\ [5pt] & = 0.4792 \ end {align} したがって、パーセンテージを指定すると、標準偏差を直接見つけることができます。偏差。 -
バックトラッキングの場合、 $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $
95%の場合、 $ z = 1.96 $ 、N = 427、 $ p = 0.642 $
$ \ sigma =?$
したがって、上記の式を使用して、逆に置き換えます。
- div id = “1c9a449 e07 “>
サンプルサイズが30未満(N < 30)、t値を使用する必要がありますZ値の代わりに( t値計算機)。 t値には自由度があります したがって、式は次のようになります。 $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $ コメント
回答
パーティーに少し遅れましたが、気づきました質問の2番目の部分は完全には対処されていませんでした-「パーセンテージ測定に適用できますか?」
OPのコメントに続いて、「パーセンテージ測定」によって、いくつかのバイナリ結果を参照していると思います(男性/女性、右利き/左利きなど)。
その場合、変数は離散確率分布で記述されますが、年齢は連続変数であり、連続確率分布で記述されます。二項変数の分布の一般的な選択は、二項分布です。二項分布の信頼区間は、さまざまな方法で作成できます( wiki )。元の調査では、 これらの信頼区間をどのように導き出したかを説明しているはずです。
user3808268が提供する式を使用して「標準偏差」を取得することもできますが、意味のある解釈が難しい。
回答
あなたが提供した説明から、最初の質問は人々の年齢の分布についてです。通常(つまりガウス分布) )分布はそのような種類のアプリケーションに適用されます。
CIの計算方法はさまざまであるため、信頼区間(CI)の計算方法を知っていると役立ちます。分布は正規分布であり、CIはt検定を使用して計算された場合、SDは次の式で推定できます。
SD = sqrt(n)*(ci_upper –ci_lower)/(2 * tinv((1-CL)/ 2; n-1))、
ここで、CLは信頼水準、「ci_upper」と「ci_lower」はそれぞれCIの上限と下限、「tinv () “はStudentのTcdfの逆数です。
それ以外の場合、正規分布であるが、CIの計算に既知のSDが使用された場合、SDは次の式で計算できます。
SD = sqrt(n)*(ci_upper –ci_lower)/(sqrt(8)* erfinv(CL))、
wh ere “erfinv()”は逆誤差関数です。
2番目の質問は、人々の性別の分布についてです(つまり、男性か女性)。 あなたが提供したデータから、サンプル全体のn = 427の中にk = 274人の男性がいるように思われます。 ベルヌーイ分布がこのアプリケーションに適用されます。 この場合、(男性の母集団の)分散= p *(1-p)= 0.2299、SD = sqrt(0.2299)= 0.4795、ここでpは平均値です。"分散=平均*(1-平均)"はベルヌーイ分布にのみ適用されます。