A bootstrap hátránya (wikiből)

A wikipédiában a bootstrap hátrányáról a következőket mondja:

A látszólagos egyszerűség elfedheti azt a tényt, hogy a rendszerindítási elemzés elvégzése során fontos feltételezések történnek (pl. a minták függetlensége), ahol ezeket más megközelítések formálisabban megfogalmaznák.

Meg tudná magyarázni ezt az állítást?

Megjegyzések

Válasz

  1. Ez “wiki, olvassa el az összes wikit egy szem sóval. Fel kell tennie egy olyan zászlót, amely nem világos, véleményalapú vagy idézésre szorul, mert ezek mind (részben) igazak. A statisztikák közelmúltbeli beáramlása, akik úgy érzik, hogy formális bizonyítás nélkül is széles körű kijelentéseket lehet tenni és papagájolni (bele kell foglalnom magam ebbe az állításba).

  2. A bootstrap nem szükséges-e a minták függetlensége. Vannak speciális bootstrapping eljárások, amelyek hatékonyabbak , mint a feltétel nélküli bootstrap

  3. A cikk kritikus hibát jelent, ha összekapcsolja a bootstrap replikátumok létrehozásának eljárását. adatkészlet (amelynek nincsenek nincs feltételezése), és bootstrap intervallumok / p-értékek megszerzése egy tesztstatisztikához. A BCa, a Quantile, a Normal Percentile és a Double Bootstrap módszerek csak részei azoknak, amelyek odakint vannak, és mindegyiket úgy fejlesztették ki, hogy a vizsgálati adatok már bootolt replikáin végezhetők el. Alapvetően nincs egyetlen módszer a CI megszerzésére és a p-értékek, és a furcsaság végül inkább a választott statisztika függvénye, mintsem maguk az adatok attribútuma.

Megjegyzések

  • A bootstrap nem követeli meg, hogy a minták függetlenek legyenek. Úgy gondolom, hogy ezt egy hasznosabb válasz érdekében ki kell terjeszteni. Például a fürt bootstrapja nem ' nem szükséges az, hogy az egyedi megfigyelések függetlenek legyenek, de a fürtökre is szükség van! Az idősorokhoz tartozó bootstrap blokkolása egy érdekesebb eset, de I ' nem tudom, hogy ' aszimptotikusan indokolt-e (nem mondom, hogy ' nem, csak mondom ' s rajtam kívül) . Legalábbis a " vanília " bootstrap, amelyre a legtöbb ember gondolkodik, függetlenséget igényel.
  • @CliffAB Azt állítom, hogy ezek a hatékonyság szempontjai, de nem feltétlenül a következtetés szempontjából. Ha feltétel nélküli bootstrap-ot használ egy korrelációval rendelkező mintában, és az egyes almintákban megbecsüli a GLS-paramétereket, a becslések szélesebb körben változnak a klaszter méretének hozzáadott változékonysága miatt, de nincs más hatás. A letiltott bootstrap javítaná a hatékonyságot.
  • Félek, hogy nem értem megjegyzésedet: ha figyelmen kívül hagytad volna, nem értem a megjegyzésedet: ha figyelmen kívül hagytad a fürtökön belüli összefüggések és blokkok helyett mintavételezett egyedi egységek, a standard hiba bootstrap becslése (például) óriási torzítással bírna, és nem lenne következetes becslő. Így a következtetés érvénytelen lenne.
  • @CliffAB, ha súlyozott bootstrapot használ a fürtön belüli vagy belüli variancia becsléséhez, minden bizonnyal ugyanazokkal a vonzó tulajdonságokkal rendelkezik, mint egy súlyozott minta elvégzése. De a te esetedben azt mondanám, hogy rossz varianciabecslőt használsz. A rendszerindítási sávban szereplő mintában a GLS varianciabecslőt kell használni.
  • Most már ' zavartabb vagyok: miért használná a GLS varianciabecslőjét a bootstrap helyett a standard hibák becslése? Referenciaként: ' m arra utalok, hogy egy fürt bootstrap-ot használok a korrelált minták címzésére, vagyis hu.wikipedia.org/wiki/ …

Válasz

Ez lehet összefügg azzal a ténnyel, hogy a bootstrap néha nagyjából “feltételezés nélküli” eljárásként mutatható be, amely más általános pl. teszteket végez, ha a szükséges feltételezések (pl. normalitás) nem teljesülnek. A rendszerindítás azonban csak bizonyos helyzetekben releváns, feltételezések felvetésével, amelyeknek szintén teljesülniük kell.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük