ブートストラップの不利な点(wikiから)

ブートストラップの不利な点についてのウィキペディアでは、次のように述べています。

明らかな単純さは、ブートストラップ分析(サンプルの独立性など)を実行するときに重要な仮定が行われているという事実を隠している可能性があります。これらは他のアプローチでより正式に述べられています。

このステートメントについて説明していただけますか?

コメント

回答

  1. それ”s wiki、すべてのwikiを一粒の塩で読んでください。不明確、意見に基づく、または引用が必要であるというフラグを立てる必要があります。それらはすべて(部分的に)真実です。正式な証明なしに幅広いステートメントを作成してオウム化できると感じている統計学者の最近の流入は、統治する必要があります(私はそのステートメントに自分自身を含めます)。

  2. ブートストラップサンプルが独立している必要はありません 。無条件のブートストラップよりも効率的な特別なブートストラップ手順があります

  3. この記事では、ブートストラップ複製を生成する手順を混同するという重大な誤りがあります。データセット(仮定がまったくない)および検定統計量のブートストラップ間隔/ p値の取得。 BCa、Quantile、Normal Percentile、およびDouble Bootstrapメソッドは、そこにあるもののサブセットにすぎず、すべて、スタディデータのすでにブートストラップされた複製で実行されるように開発されています。基本的に、CIを取得する方法は1つではありません。とp値、そして奇妙さは、データ自体の属性ではなく、選択された統計の関数であることになります。

コメント

  • ブートストラップでは、サンプルが独立している必要はありません。より有用な回答を得るために、これを拡張する必要があると思います。たとえば、クラスターブートストラップは' 個々の観測値が独立している必要はありませんが、クラスターが独立している必要があります!時系列のブロックブートストラップはより興味深いケースですが、I ' 'がどのように漸近的に正当化されるのかわからない('ではなく、単に'私を超えて) 。少なくとも、ほとんどの人が考える" vanilla "ブートストラップは独立性が必要です
  • @CliffABこれらは効率の考慮事項であると主張しますが、必ずしも推論の考慮事項ではありません。相関のあるサンプルで無条件のブートストラップを使用し、各サブサンプルのGLSパラメーターを推定すると、クラスターサイズの変動が増えるため、推定値はより大きく変動しますが、他の影響はありません。ブートストラップをブロックすると効率が向上します。
  • '恐れ入りますが'コメントがわかりません:無視した場合クラスター内の相関と、ブロックではなくサンプリングされた個々のユニットの場合、(たとえば)標準誤差のブートストラップ推定には大きなバイアスがあり、一貫した推定量にはなりません。したがって、推論は無効になります。
  • @CliffABは、加重ブートストラップを使用してクラスター間またはクラスター内の分散を推定しますが、加重サンプルを実行する場合と同じ魅力的な特性があります。しかし、あなたの場合、あなたは間違った分散推定量を使用していると思います。ブートストラップされたサンプルではGLS分散推定量を使用する必要があります。
  • 今ではもっと混乱しています。ブートストラップではなくGLS分散推定量を使用するのはなぜですか。標準誤差の推定?参考までに、私は'クラスターブートストラップを使用して相関サンプルに対処することを指します。つまり、 en.wikipedia.org/wiki/ …

回答

これはブートストラップは、他の一般的な例を置き換えるために使用できる「仮定のない」手順として大まかに提示される場合があるという事実に関連しています。必要な仮定(正規性など)が満たされていない場合にテストします。ただし、ブートストラップは、満たす必要のある仮定を立てる特定の状況でのみ関係します。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です