学生のグループには、18人中2人がいますそれは左利きです。情報量の少ない事前確率を仮定して、母集団内の左利きの学生の事後分布を見つけます。結果を要約します。文献によると、5〜20%の人が左利きです。あなたの前にこの情報を考慮に入れて、新しい後を計算してください。
ここではベータ分布を使用する必要があることを知っています。まず、 $ \ alpha $ と
$$ \ pi(r \ vert Y)\ propto r ^ {(Y + -1)} \回(1 − r)^ {(N−Y + −1)} \\ $$
$ Y = 2 $ 、 $ N = 18 $
なぜ
$ Rの期待値を与える方程式既知の
いくつかのヒントをいただければ幸いです。事前分布と事後分布についての一般的な講義も害はありません(私はそれらが何であるかを漠然と理解していますが、漠然としているだけです)また、私はあまり高度な統計学者ではないことを覚えておいてください(実際には私は私の主な貿易による政治学者です)数学はおそらく私の頭上を飛ぶでしょう。
コメント
- をご覧になりましたか質疑応答?
- フレーズ" 左利きの学生の事後分布を見つける "は意味がありません。ランダム変数には分布があり、"左利きの学生"は tarvあなたが意図していると思います" 事後分布を見つけます 比率 左利きの学生 "。'は、そのような詳細を詳しく説明するのではなく、明確にすることが重要です。あなたが'実際に話していること
- 実際、あなたの質問を読んでいると、あなたの問題は'確率分布を単に理解するほど多くのベイズ統計。 ' s 常に分布関数(またはそこにある確率関数)の引数が未知の関数(確率関数)である場合変数)。 それは'完全に彼らの要点です。
- コメントは詳細な議論のためのものではありません。この会話はチャットに移動されました。
回答
最初に共役事前分布とは何かを説明しましょう。次に、特定の例を使用してベイズ分析について説明します。ベイズ統計には、次の手順が含まれます。
- パラメータに関する主観的な信念を組み込んだ事前分布を定義します(この例では、対象のパラメータは左の比率です-ハンダー)。事前確率は「非情報」または「有益」にすることができます(ただし、情報のない事前確率はありません。こちらの説明を参照してください)。
- データを収集します。
- ベイズの定理を使用してデータで事前分布を更新し、事後分布を取得します。事後分布は、パラメーターに関する更新された信念を表す確率分布です。データを見た後。
- 事後分布を分析し、要約します(平均、中央値、sd、量子など)。
すべてのベイズ統計の基礎はベイズの定理です。これは
$$ \ mathrm {posterior} \ propto \ mathrm {prior} \ times \ mathrm {likelihood} $$
あなたの場合、確率は二項分布です。事前分布と事後分布が同じファミリーにある場合、 事前分布と事後分布は共役分布と呼ばれます。事後確率もベータ分布であるため、ベータ分布は共役事前分布です。ベータ分布は二項尤度の共役ファミリーであると言います。 。共役分析は便利ですが、実際の問題ではめったに発生しません。ほとんどの場合、事後分布はMCMCを介して数値で見つける必要があります(Stan、WinBUGS、OpenBUGS、JAGS、PyMC、またはその他のプログラムを使用)。
事前確率分布が1に統合されない場合、それは不適切な事前確率と呼ばれ、1に統合される場合、それは適切な事前確率と呼ばれます。ほとんどの場合、不適切なpriまたはベイズ分析に大きな問題を引き起こさない。ただし、事後分布は適切である必要があります。つまり、事後分布は1に統合される必要があります。
これらの経験則は、ベイジアン分析手順の性質に直接準拠しています。
- 事前確率が有益でない場合、事後確率はデータによって非常に決定されます(事後確率はデータ駆動型です)
- 事前確率が有益である場合、事後確率は事前確率と事後確率の混合です。データ
- 事後確率は事前情報によって大きく左右されるため、いわば、事前確率が情報量が多いほど、信念を「変更」するために必要なデータが多くなります。
- 大量のデータがある場合、データは事後分布を支配します(事前分布を圧倒します)
ベータ分布のいくつかの可能な「有益な」および「有益でない」事前確率の優れた概要この投稿にあります。
以前のベータ版が
事後ベータ分布は単純に
あなたの場合、 $ z = 2 $ と
div>
事前分布は情報量が少ないため、事後分布は完全にデータによって駆動されていることがわかります。また、事後分布の最高密度区間(HDI)もプロットされています。事後分布を2D盆地に置き、分布の95%が喫水線より上になるまで水を充填し始めると想像してください。喫水線が事後分布と交差するポイントは、95%-HDIを構成します。 HDI内のすべてのポイントは、HDI外のどのポイントよりも確率が高くなります。また、HDIには常に事後分布のピーク(つまり最頻値)が含まれます。 HDIは、後部の各尾から2.5%が除外される等尾95%の信頼区間とは異なります(ここを参照)。
2番目のタスクでは、人口の5〜20%が左利きであるという情報を組み込むように求められます。これを行うには、いくつかの方法があります。最も簡単な方法は、事前ベータ分布に $ 0.125 $ の平均。これは
事前情報について確信が持てない場合は、<を設定できます。疑似サンプルのspanclass = "math-container"> $ n_ {eq} $ をたとえば
事前情報を組み込むより高度な方法は、事前ベータ分布の $ 0.025 $ 分位数が約 $ 0.05 $ およびLearnBayes
の関数beta.select
は、対応する $ \ alpha $ spanを計算します。 >および
library(LearnBayes) quantile1=list(p=.025, x=0.05) # the 2.5% quantile should be 0.05 quantile2=list(p=.975, x=0.2) # the 97.5% quantile should be 0.2 beta.select(quantile1, quantile2) [1] 7.61 59.13
パラメーターが
ベイジアン推論と簡単な分析の短いがわかりにくい概要については、このリファレンスも参照してください。共役解析、特に二項データの詳細については、こちらをご覧ください。ベイジアン思考の一般的な紹介は、ここにあります。ベイズ統計の側面に関するその他のスライドは、こちらです。
コメント
- 理由ここでベータ分布を選択しますか?
- @Metallica主な理由は、ベータが二項分布の共役事前分布であるためです。これは、前にベータを選択した場合、後部もベータになることを意味します。さらなる理由は、ベータが0から1の間であり、非常に柔軟性があることです。たとえば、ユニフォームが含まれます。ただし、$(0,1)$でサポートされている適切な配布は、以前と同じように使用できます。 'は、後部の計算がより難しいということです。
- グラフがRでプロットされている場合は?上記のグラフを生成するためにRコードを追加していただけませんか?彼らは本当に役に立ちます。ありがとう!
- 情報量の少ない事前確率はジェフリー'の事前確率$ \ alpha = \ beta = \ frac 1 2 $ …なぜだと思いますかそうではありませんか?
- @meduz厳密に言えば、実際の"情報量の少ない"の事前確率はありません。このディスカッションについて、ティムによる優れた回答を紹介したいと思います。
回答
$ \ alpha $ = 1および$ \ beta $ = 1のベータ分布は、一様分布と同じです。つまり、実際には均一です。あなたは、分布のパラメータ(この場合、人々のグループにおける左利きの人々のパーセンテージ)に関する情報を見つけようとしています。ベイズの公式は次のように述べています。
$ P(r | Y_ {1、 …、n})$ = $ \ frac {P(Y_ {1、…、n} | r)* P(r)} {\ int P(Y_ {1、…、n} | \ theta)* P(r)} $
あなたが指摘したことは次のように比例します:
$ P(r | Y_ {1、…、n})$ $ \ propto $ $(Y_ {1、…、n} | r)* P(r)$
つまり、基本的には、グループ内の左利きの割合についての以前の信念から始めます。 (P(r)、これは「均一な距離を使用しています)」次に、収集したデータを考慮して、事前に通知します(この場合は二項分布です。右利きまたは左利きのどちらかなので、$ P(Y_ { 1、…、n} | r)$)。二項分布には事前分布のベータ共役があります。つまり、事後分布$ P(r | Y_ {1、… n})$は、データを考慮した後のパラメーターの分布が事前分布と同じファミリーにあることを意味します。ここでのrは結局不明ではありません。 (率直に言って、データを収集する前ではありませんでした。社会における左利きの割合についてはかなり良い考えがあります。)事前分布(rの仮定)とデータの両方を取得しました。 2つを組み合わせます。事後は、データを考慮した後の左利きの分布の新しい仮定です。したがって、データの尤度を取得し、それをユニフォームで乗算します。ベータ分布の期待値(ポスターが何であるか)は$ \ frac {\ alpha} {\ alpha + \ beta} $です。したがって、開始したとき、$ \ alpha $ = 1および$ \ beta $ = 1での仮定は、世界の左利きの割合が$ \ frac {1} {2} $であるというものでした。これで、18人中2人の左利きのデータを収集しました。後部を計算しました。 (まだベータ版です)$ \ alpha $と$ \ beta $の値が異なり、左利きと右利きの比率の考え方が変わりました。どのように変更されましたか?
回答
質問の最初の部分で、「r」の適切な事前定義を定義するように求められます。 “。二項データが手元にあるので、ベータ分布を選択するのが賢明です。なぜなら、後部はベータになるからです。一様分布はベータの特殊なケースであるため、「r」の事前分布を選択して、「r」のすべての可能な値が等しくなる可能性を持たせることができます。
2番目の部分で提供した事前分布「r」に関する情報。
これを手にすると、@ COOLSerdashの回答から適切な指示が得られます。
この質問を投稿していただきありがとうございます。COOLSerdashは適切な回答を提供していただきありがとうございます。