A wikipédiában a bootstrap hátrányáról a következőket mondja:
A látszólagos egyszerűség elfedheti azt a tényt, hogy a rendszerindítási elemzés elvégzése során fontos feltételezések történnek (pl. a minták függetlensége), ahol ezeket más megközelítések formálisabban megfogalmaznák.
Meg tudná magyarázni ezt az állítást?
Megjegyzések
- Kapcsolódó: Miért van borzalmas lefedettsége a bootstrap intervallumnak?
- Csak nem értem az állítást.
- A bootstrap eljárás mintái függenek, de a kapott mintavétel Az elosztást úgy kezeljük, mintha az iid értékek hozták volna létre.
Válasz
-
Ez “wiki, olvassa el az összes wikit egy szem sóval. Fel kell tennie egy olyan zászlót, amely nem világos, véleményalapú vagy idézésre szorul, mert ezek mind (részben) igazak. A statisztikák közelmúltbeli beáramlása, akik úgy érzik, hogy formális bizonyítás nélkül is széles körű kijelentéseket lehet tenni és papagájolni (bele kell foglalnom magam ebbe az állításba).
-
A bootstrap nem szükséges-e a minták függetlensége. Vannak speciális bootstrapping eljárások, amelyek hatékonyabbak , mint a feltétel nélküli bootstrap
-
A cikk kritikus hibát jelent, ha összekapcsolja a bootstrap replikátumok létrehozásának eljárását. adatkészlet (amelynek nincsenek nincs feltételezése), és bootstrap intervallumok / p-értékek megszerzése egy tesztstatisztikához. A BCa, a Quantile, a Normal Percentile és a Double Bootstrap módszerek csak részei azoknak, amelyek odakint vannak, és mindegyiket úgy fejlesztették ki, hogy a vizsgálati adatok már bootolt replikáin végezhetők el. Alapvetően nincs egyetlen módszer a CI megszerzésére és a p-értékek, és a furcsaság végül inkább a választott statisztika függvénye, mintsem maguk az adatok attribútuma.
Megjegyzések
- A bootstrap nem követeli meg, hogy a minták függetlenek legyenek. Úgy gondolom, hogy ezt egy hasznosabb válasz érdekében ki kell terjeszteni. Például a fürt bootstrapja nem ' nem szükséges az, hogy az egyedi megfigyelések függetlenek legyenek, de a fürtökre is szükség van! Az idősorokhoz tartozó bootstrap blokkolása egy érdekesebb eset, de I ' nem tudom, hogy ' aszimptotikusan indokolt-e (nem mondom, hogy ' nem, csak mondom ' s rajtam kívül) . Legalábbis a " vanília " bootstrap, amelyre a legtöbb ember gondolkodik, függetlenséget igényel.
- @CliffAB Azt állítom, hogy ezek a hatékonyság szempontjai, de nem feltétlenül a következtetés szempontjából. Ha feltétel nélküli bootstrap-ot használ egy korrelációval rendelkező mintában, és az egyes almintákban megbecsüli a GLS-paramétereket, a becslések szélesebb körben változnak a klaszter méretének hozzáadott változékonysága miatt, de nincs más hatás. A letiltott bootstrap javítaná a hatékonyságot.
- Félek, hogy nem értem megjegyzésedet: ha figyelmen kívül hagytad volna, nem értem a megjegyzésedet: ha figyelmen kívül hagytad a fürtökön belüli összefüggések és blokkok helyett mintavételezett egyedi egységek, a standard hiba bootstrap becslése (például) óriási torzítással bírna, és nem lenne következetes becslő. Így a következtetés érvénytelen lenne.
- @CliffAB, ha súlyozott bootstrapot használ a fürtön belüli vagy belüli variancia becsléséhez, minden bizonnyal ugyanazokkal a vonzó tulajdonságokkal rendelkezik, mint egy súlyozott minta elvégzése. De a te esetedben azt mondanám, hogy rossz varianciabecslőt használsz. A rendszerindítási sávban szereplő mintában a GLS varianciabecslőt kell használni.
- Most már ' zavartabb vagyok: miért használná a GLS varianciabecslőjét a bootstrap helyett a standard hibák becslése? Referenciaként: ' m arra utalok, hogy egy fürt bootstrap-ot használok a korrelált minták címzésére, vagyis hu.wikipedia.org/wiki/ …
Válasz
Ez lehet összefügg azzal a ténnyel, hogy a bootstrap néha nagyjából “feltételezés nélküli” eljárásként mutatható be, amely más általános pl. teszteket végez, ha a szükséges feltételezések (pl. normalitás) nem teljesülnek. A rendszerindítás azonban csak bizonyos helyzetekben releváns, feltételezések felvetésével, amelyeknek szintén teljesülniük kell.