初心者のためのブロックブートストラップ

私の質問を文脈に当てはめると、私は物理学者ですが、統計への露出が限られており、それについて学んだことは30を超えていました数年前。

ブロックブートストラップについて学習しようとしています。その手法は、現在取り組んでいる問題の解決に適している可能性があるためです。ブロックブートストラップの数学に関する多くの論文/本/情報を見つけることができますが、移動ブロックブートストラップ、円形ブロックブートストラップ、固定ブロックブートストラップなどの問題に「冒険」する前に、ブロックブートストラップのプロセスの一般的な説明を最初に見つけたいと思います、ブロック長、サンプルサイズなど。

相関データをオーバーサンプリングしました。5つの変数(列)と10000の観測値(行)を約100行のデータに減らしたいと考えています。データは時系列ですが、連続的ではなく、異なる場所からのデータも含まれている可能性があります。つまり、同時に異なるデータを持つことができます(後者がブロックブートストラップの問題である場合は、「重複した」データを削除できます)時間内に)。ブロックブートストラップにより、データの相関関係を複製できます。

最終的な目的は、完全なデータセットと縮小されたデータセットのpdfとcdfの両方が同じになるように、データセットを最大100行のデータに縮小することです。 (まだ定義されていない最小エラー範囲内)5つの変数すべてについて。

質問:1)ブロックブートストラップはこれを実行できますか? 2)これが行われる段階的なプロセスは何ですか?ここに完全なプロセスを詳しく書く人はいないと思いますが、誰かがYouTubeビデオや「ダミーのブートストラップ」を公開している可能性があります。

同様のことを調べました。ここにブロックブートストラップに関する質問があり、「時系列分析でブロックブートストラップについて学ぶためのリソース」に関する質問がありますが、回答の参照は、私がまだ習得しなければならない統計リテラシーを前提としています。

コメント

  • この紹介はどうですか?ブートストラップとブロックブートストラップの紹介があります。

回答

時系列のモデルフリーのリサンプリングは、ブロックブートストラップとも呼ばれるブロックリサンプリングによって実現されます。これは、 Rのブートパッケージのtsboot関数。時系列を連続観測のほぼ等しい長さのブロックに分割し、置換してブロックをリサンプリングしてから、ブロックを貼り付けて取得するという考え方です。彼女。たとえば、時系列の長さが200で、長さが20のブロックを10個使用する場合、ブロックは最初の20個の観測値、次の20個の観測値というようになります。可能なリサンプルは、4番目のブロック(観測値61から80)、最後のブロック(観測値181から200)、2番目のブロック(観測値21から40)、そして4番目のブロックというように、10個のブロックになるまで続きます。リサンプルで。 時系列データを使用してブートストラップを行うにはどうすればよいですか?

コメント

  • 内容ブーストラッピングについて説明されたエコノミアは正しいですが、ブートストラップされたサンプルは、データセットを同じ基本分布を持つより小さなデータセットに縮小するために使用されないことに注意してください。 (あなたが言ったことがあなたの目標でした)。ブートストラップは、ブートストラップされたサンプルを作成し、ブートストラップされたサンプルの経験的分布に関して統計(テストされているもの)がどこにあるかを確認することによって、いくつかの仮説をテストするために使用されます。したがって、データセットをより小さなデータセットに縮小することは、bstrappingの目標ではありません。 'はモデルのない方法で仮説検定に使用されます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です