In Wikipedia zum Nachteil von Bootstrap heißt es:
Die offensichtliche Einfachheit kann die Tatsache verbergen, dass bei der Durchführung der Bootstrap-Analyse wichtige Annahmen getroffen werden (z. B. Unabhängigkeit von Stichproben), die in anderen Ansätzen formeller angegeben würden.
Könnten Sie bitte diese Aussage erläutern?
Kommentare
- Verwandte Themen: Warum hat mein Bootstrap-Intervall eine schreckliche Abdeckung?
- Ich verstehe die Aussage einfach nicht.
- Die Beispiele einer Bootstrap-Prozedur sind abhängig, aber das erhaltene Beispiel Die Verteilung wird so behandelt, als ob sie durch iid-Werte erstellt wurde.
Antwort
-
Es „s Wiki, lesen Sie alle Wiki mit einem Körnchen Salz. Sie sollten eine Flagge als unklar, meinungsbasiert oder zitierungsbedürftig hissen All dies ist (teilweise) wahr. Der jüngste Zustrom von Personen in Statistiken, die der Meinung sind, dass breite Aussagen ohne formellen Beweis gemacht und nachgeahmt werden können, muss berücksichtigt werden (ich beziehe mich in diese Aussage ein).
-
Der Bootstrap erfordert nicht , dass die Stichproben unabhängig sind. Es gibt spezielle Bootstrapping-Prozeduren, die effizienter sind als ein bedingungsloser Bootstrap
-
Der Artikel macht den kritischen Irrtum, die Prozedur zum Generieren von Bootstrap-Replikaten von a zusammenzuführen Datensatz (der überhaupt keine Annahmen hat) und Abrufen von Bootstrap-Intervallen / p-Werten für eine Teststatistik. Die Methoden BCa, Quantile, Normal Percentile und Double Bootstrap sind nur eine Teilmenge dessen, was es gibt. Sie wurden alle entwickelt, um an bereits gebooteten Replikaten der Studiendaten durchgeführt zu werden. Grundsätzlich gibt es keine einzige Methode zum Abrufen von CIs und p-Werte, und die Verrücktheit ist letztendlich eher eine Funktion der gewählten Statistik als ein Attribut der Daten selbst.
Kommentare
- Der Bootstrap erfordert nicht, dass Beispiele unabhängig sind. Ich denke, dies sollte erweitert werden, um eine nützlichere Antwort zu erhalten. Zum Beispiel hat der Cluster-Bootstrap nicht ' erfordert nicht, dass einzelne Beobachtungen unabhängig sind, aber es müssen Cluster vorhanden sein! Block-Bootstrap für Zeitreihen ist ein interessanterer Fall, aber ich ' Ich bin mir nicht sicher, wie das ' asymptotisch gerechtfertigt ist (nicht sagen ' nicht, nur sagen ' ist mir ein Rätsel) . Zumindest erfordert der " Vanille " Bootstrap, an den die meisten Leute denken, dass Unabhängigkeit erfordert.
- @CliffAB Ich würde argumentieren, dass dies Überlegungen zur Effizienz sind, aber nicht unbedingt zur Schlussfolgerung. Wenn Sie in einer Stichprobe mit Korrelation bedingungslosen Bootstrap verwenden und die GLS-Parameter in jeder Teilstichprobe schätzen, variieren die Schätzungen aufgrund der zusätzlichen Variabilität der Clustergröße, jedoch ohne weitere Auswirkungen. Ein blockierter Bootstrap würde die Effizienz verbessern.
- Ich ' befürchte, dass ich ' Ihren Kommentar nicht verstehe: Wenn Sie ihn ignorieren Die Korrelationen innerhalb von Clustern und abgetasteten einzelnen Einheiten anstelle von Blöcken, Ihre Bootstrap-Schätzung des Standardfehlers (zum Beispiel) hätte eine enorme Verzerrung und wäre kein konsistenter Schätzer. Eine Inferenz wäre daher ungültig.
- @CliffAB, das einen gewichteten Bootstrap verwendet, um die Varianz zwischen oder innerhalb des Clusters zu schätzen, weist mit Sicherheit die gleichen attraktiven Merkmale auf wie die Durchführung einer gewichteten Stichprobe. Aber ich würde in Ihrem Fall sagen, dass Sie den falschen Varianzschätzer verwenden. Der GLS-Varianzschätzer sollte im Bootstrap-Beispiel verwendet werden.
- Jetzt bin ich ' verwirrter: Warum sollten Sie den GLS-Varianzschätzer anstelle des Bootstraps verwenden? Schätzung der Standardfehler? Als Referenz beziehe ich mich ' auf die Verwendung eines Cluster-Bootstraps, um korrelierte Beispiele zu adressieren, dh en.wikipedia.org/wiki/ …
Antwort
Dies kann sein im Zusammenhang mit der Tatsache, dass der Bootstrap manchmal grob als „annahmefreies“ Verfahren dargestellt werden kann, das verwendet werden kann, um andere übliche z Tests, wenn ihre erforderlichen Annahmen (z. B. Normalität) nicht erfüllt sind. Bootstrapping ist jedoch nur in bestimmten Situationen relevant, in denen Annahmen getroffen werden, die ebenfalls erfüllt sein müssen.