Dans wikipedia sur le désavantage du bootstrap, il est dit:
Lapparente simplicité peut masquer le fait que des hypothèses importantes sont formulées lors de lanalyse bootstrap (par exemple, lindépendance des échantillons) alors quelles seraient plus formellement énoncées dans dautres approches.
Pourriez-vous, sil vous plaît, expliquer cette déclaration?
Commentaires
- Connexes: Pourquoi mon intervalle damorçage a-t-il une couverture terrible?
- Je ne comprends tout simplement pas linstruction.
- Les échantillons dune procédure damorçage sont dépendants mais léchantillonnage obtenu distribution est traitée comme si elle avait été créée par des valeurs iid.
Answer
-
Il « s wiki, lisez tous les wiki avec un grain de sel. Vous devriez soulever un drapeau comme nétant pas clair, basé sur une opinion ou ayant besoin dune citation parce que tout cela est (en partie) vrai. Lafflux récent de personnes dans les statistiques qui estiment que des déclarations générales peuvent être faites et parrottées sans preuve formelle doit être maîtrisé (je minclus dans cette déclaration).
-
Le bootstrap nexige pas que les échantillons soient indépendants. Il existe des procédures damorçage spéciales qui sont plus efficaces quun bootstrap inconditionnel
-
Larticle fait lerreur critique de confondre la procédure de génération de répliques bootstrap dun ensemble de données (qui na aucune hypothèse) et obtenir des intervalles damorçage / valeurs p pour une statistique de test. Les méthodes BCa, Quantile, Normal Percentile et Double Bootstrap ne sont quun sous-ensemble de ce qui existe et sont toutes développées pour être exécutées sur des répliques déjà amorcées des données de létude. Fondamentalement, il nexiste pas de méthode unique pour obtenir des IC et p-values, et létrangeté finit par être plus une fonction de la statistique choisie que cest un attribut des données elles-mêmes.
Commentaires
- Le bootstrap ne nécessite pas que les échantillons soient indépendants. Je pense que cela devrait être développé pour une réponse plus utile. Par exemple, le cluster bootstrap ne fait pas ' t nécessite que les observations individuelles soient indépendantes, mais cela nécessite que les clusters soient! Le block bootstrap pour les séries chronologiques est un cas plus intéressant, mais je ' je ne sais pas comment cela ' est asymptotiquement justifié (ne pas le dire ' non, il suffit de le dire ' est au-delà de moi) . À tout le moins, le bootstrap " vanille " auquel la plupart des gens pensent nécessite lindépendance.
- @CliffAB Je dirais que ce sont des considérations defficacité, mais pas nécessairement dinférence. Si vous utilisez le bootstrap inconditionnel dans un échantillon avec corrélation et que vous estimez les paramètres GLS dans chaque sous-échantillon, les estimations deviennent plus largement variées en raison de la variabilité supplémentaire de la taille de la grappe, mais sans autre impact. Un bootstrap bloqué améliorerait lefficacité.
- Je ' jai peur de ne pas ' comprendre votre commentaire: si vous lavez ignoré les corrélations au sein des grappes et des unités individuelles échantillonnées au lieu de blocs, votre estimation bootstrap de lerreur standard (par exemple) aurait un biais énorme et ne serait pas un estimateur cohérent. Ainsi, linférence serait invalide.
- @CliffAB utilisant un bootstrap pondéré pour estimer la variance entre ou intra-grappes a certainement les mêmes caractéristiques attractives que la réalisation dun échantillon pondéré. Mais je dirais que dans votre cas, vous utilisez le mauvais estimateur de variance. Lestimateur de variance GLS doit être utilisé dans léchantillon bootstrap.
- Maintenant, je ' m plus confus: pourquoi utiliser lestimateur de variance GLS plutôt que dutiliser le bootstrap estimation des erreurs types? Pour référence, je ' fait référence à lutilisation dun cluster bootstrap pour traiter des échantillons corrélés, cest-à-dire en.wikipedia.org/wiki/ …
Réponse
Cela peut être lié au fait que le bootstrap peut parfois être grossièrement présenté comme une procédure « sans hypothèse » qui peut être utilisée pour remplacer dautres par ex. tests lorsque leurs hypothèses requises (par exemple, normalité) ne sont pas satisfaites. Cependant, le bootstrap nest pertinent que dans certaines situations soulevant des hypothèses qui doivent également être satisfaites.