In wikipedia over nadeel van bootstrap staat:
De schijnbare eenvoud kan het feit verhullen dat er belangrijke aannames worden gedaan bij het uitvoeren van de bootstrap-analyse (bijv. onafhankelijkheid van steekproeven) waar deze formeler zouden worden vermeld in andere benaderingen.
Kunt u alstublieft deze verklaring toelichten?
Opmerkingen
- Gerelateerd: Waarom heeft mijn bootstrap-interval een vreselijke dekking?
- Ik begrijp de verklaring gewoon niet.
- De voorbeelden van een bootstrap-procedure zijn afhankelijk, maar de verkregen steekproeven distributie wordt behandeld alsof het is gemaakt door iid-waarden.
Answer
-
Het s wiki, lees alle wiki met een korreltje zout. U moet een vlag hijsen als onduidelijk, op meningen gebaseerd of een citaat nodig omdat die zijn allemaal (gedeeltelijk) waar. De recente toestroom van mensen in de statistieken die vinden dat brede uitspraken kunnen worden gedaan en geparroteerd zonder formeel bewijs, moet worden geregeerd (ik neem mezelf op in die verklaring).
-
De bootstrap vereist niet dat samples onafhankelijk zijn. Er zijn speciale bootstrapping-procedures die efficiënter zijn dan een onvoorwaardelijke bootstrap
-
Het artikel maakt de kritische misvatting door de procedure voor het genereren van bootstrap-replicas van een dataset (die geen aannames heeft) en het verkrijgen van bootstrap-intervallen / p-waarden voor een teststatistiek. De BCa, Quantile, Normal Percentile en Double Bootstrap-methoden zijn slechts een subset van wat er is, en zijn allemaal ontwikkeld om te worden uitgevoerd op reeds opgestarte replicas van de studiegegevens. In feite is er niet één methode om CIs te verkrijgen. en p-waarden, en de gekte wordt uiteindelijk meer een functie van de gekozen statistiek dan dat het een attribuut is van de gegevens zelf.
Opmerkingen
- De bootstrap vereist niet dat samples onafhankelijk zijn. Ik denk dat dit moet worden uitgebreid voor een nuttiger antwoord. De cluster-bootstrap heeft bijvoorbeeld geen ' vereist individuele observaties om onafhankelijk te zijn, maar het vereist wel clusters! Blok bootstrap voor tijdreeksen is een interessanter geval, maar ik ' m niet zeker hoe dat ' s asymptotisch gerechtvaardigd is (niet zeggen ' is niet, zeg het gewoon ' gaat mij te boven)De " vanilla " bootstrap waarvan de meeste mensen denken dat wel onafhankelijkheid vereist.
- @CliffAB Ik zou willen zeggen dat dit overwegingen zijn voor efficiëntie, maar niet noodzakelijkerwijs als gevolgtrekking. Als u onvoorwaardelijke bootstrap gebruikt in een steekproef met correlatie, en de GLS-parameters in elke deelsteekproef schat, worden de schattingen meer gevarieerd vanwege de toegevoegde variabiliteit in clustergrootte, maar geen andere impact. Geblokkeerde bootstrap zou de efficiëntie verbeteren.
- Ik ' ben bang dat ik ' je opmerking niet begrijp: als je negeert de correlaties binnen clusters en bemonsterde individuele eenheden in plaats van blokken, zou uw bootstrap-schatting van de standaardfout (bijvoorbeeld) een enorme vertekening hebben en geen consistente schatter zijn. De gevolgtrekking zou dus ongeldig zijn.
- @CliffAB het gebruik van een gewogen bootstrap om de variantie tussen of binnen een cluster te schatten, heeft zeker dezelfde aantrekkelijke eigenschappen als het uitvoeren van een gewogen steekproef. Maar ik zou in jouw geval zeggen dat je de verkeerde variantie-schatter gebruikt. De GLS variantie schatter zou gebruikt moeten worden in de bootstrapped steekproef.
- Nu ben ik ' meer in de war: waarom zou je de GLS variantie schatter gebruiken in plaats van de bootstrap te gebruiken? schatting van de standaardfouten? Ter referentie: ik ' m verwijs naar het gebruik van een cluster-bootstrap om gecorreleerde voorbeelden aan te pakken, dwz en.wikipedia.org/wiki/ …
Antwoord
Dit kan zijn gerelateerd aan het feit dat de bootstrap soms grofweg kan worden gepresenteerd als een “aannamesvrije” procedure die kan worden gebruikt om andere veelvoorkomende bijv. tests wanneer hun vereiste aannames (bijv. normaliteit) niet worden gehaald. Bootstrapping is echter alleen relevant in bepaalde situaties waarbij aannames worden gedaan waaraan ook moet worden voldaan.