bootstrapin haitta (wikistä)

Wikipediassa bootstrapin haitasta sanotaan:

Näennäinen yksinkertaisuus voi peittää sen, että tärkeitä oletuksia tehdään käynnistysvaiheen analyysia suoritettaessa (esim. näytteiden riippumattomuus), jos ne mainitaan muodollisemmin muissa lähestymistavoissa.

Voisitteko selittää tämän lausunnon?

Kommentit

Vastaa

  1. Se ”wiki, lue kaikki wiki suolalla. Sinun pitäisi nostaa lippu epäselväksi, mielipiteeseen perustuvaksi tai tarvitsevaksi lainausta, koska kaikki nämä ovat (osittain) totta. Viimeaikainen tilastovirta, joka katsoo, että laajoja lausuntoja voidaan tehdä ja papukaijoida ilman muodollista näyttöä, on hallittava (sisällytän itseni tähän lausuntoon).

  2. Käynnistyshihna ei vaadi näytteiden riippumattomuutta. On olemassa erityisiä käynnistysprosessointimenettelyjä, jotka ovat tehokkaampia kuin ehdoton käynnistyshihna.

  3. Artikkeli tekee kriittisen virheellisen sekoituksen menettelystä, joka muodostetaan tietojoukko (jolla ei ole lainkaan oletuksia ) ja käynnistystiedonvälien / p-arvojen hankkiminen testitilastolle. BCa-, Quantile-, Normal Percentile- ja Double Bootstrap -menetelmät ovat vain osa joukkoa mitä siellä on, ja ne kaikki on kehitetty suoritettaviksi jo käynnistettyjen tutkimustietojen kopioilla. Pohjimmiltaan ei ole olemassa yhtä menetelmää CI: n saamiseksi ja p-arvot, ja oudot päätyvät enemmän valitun tilaston funktioksi kuin itse tietojen attribuuteiksi.

Kommentit

  • Käynnistyshihna ei vaadi, että näytteet ovat riippumattomia. Mielestäni tätä tulisi laajentaa saadaksesi hyödyllisemmän vastauksen. Esimerkiksi klusterin käynnistyshihna ei ' t vaatii yksittäisten havaintojen olevan itsenäisiä, mutta se edellyttää klustereiden olevan! Estä aikasarjojen käynnistyshihna on mielenkiintoisempi tapaus, mutta I ' en ole varma, kuinka se ' on asymptoottisesti perusteltu (ei sanomalla sitä ' ei, vain sanomalla se ' s minun ulkopuolella) . Ainakin " vanilja " bootstrap, jota useimmat ihmiset ajattelevat tarvitsee , vaatii itsenäisyyttä.
  • @CliffAB Väitän, että nämä ovat tehokkuuden, mutta ei välttämättä johtopäätösten näkökohtia. Jos käytät ehdotonta käynnistyshihnaa korrelaatiot sisältävässä näytteessä ja arvioit jokaisen alinäytteen GLS-parametrit, estimaatit vaihtelevat laajemmin klusterikoon lisääntyneen vaihtelun vuoksi, mutta ei muita vaikutuksia. Estetty käynnistyshihna parantaisi tehokkuutta.
  • Pelkään ' pelkäävän, etten ymmärrä kommenttisi: jos ohitit korrelaatioilla klustereissa ja otoksissa yksittäisissä yksiköissä lohkojen sijasta, käynnistysstrap-estimaatilla standardivirheestä (esimerkiksi) olisi valtava puolueellisuus eikä se olisi johdonmukainen estimaattori. Siten päätelmä olisi virheellinen.
  • @CliffAB: lla, jolla painotetun käynnistysstrapin avulla arvioidaan klusterin välinen tai sisäinen varianssi, on varmasti samat houkuttelevat piirteet kuin painotetun näytteen suorittamisessa. Mutta sanoisin tapauksessasi, että käytät väärää varianssiestimaattoria. GLS-varianssiestimaattoria tulisi käyttää käynnistysstrapoidussa näytteessä.
  • Nyt olen ' hämmentyneempi: miksi käyttäisit GLS-varianssiestimaattoria käynnistysstrapin sijaan arvio standardivirheistä? Viitteenä minä ' m viittaan klusterin käynnistyshihnan käyttämiseen vastaavien näytteiden eli fi.wikipedia.org/wiki/ …

Vastaa

Tämä voi olla liittyy siihen, että käynnistyshihna voidaan joskus esittää karkeasti ”oletuksettomana” menettelynä, jota voidaan käyttää korvaamaan muita yleisiä esim. testit, kun heidän vaadittavat oletuksensa (esim. normaalisuus) eivät täyty. Käynnistysprosessilla on kuitenkin merkitystä vain tietyissä tilanteissa, mikä herättää oletuksia, jotka on myös täytettävä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *