Estä aloittelijan käynnistyshihna

Kysymykseni kontekstiin asettamiseksi olen fyysikko, mutta altistun tilastoille rajallisesti ja olen oppinut siitä yli 30 vuosia sitten.

Yritän oppia estokäynnistyksen estämisestä, koska tekniikka saattaa sopia ongelman ratkaisemiseen. Voin löytää paljon papereita / kirjoja / tietoa lohkon käynnistysseurannan matematiikasta, mutta haluaisin ensin löytää yleisen kuvauksen lohkon käynnistysprosessin prosessista, ennen kuin ”pääsee käsittelemään” sellaisia asioita kuin lohkon käynnistyslohko, pyöreä lohkon käynnistys, kiinteä lohkon käynnistys , lohkojen pituudet, näytteet jne.

Olen yliannostanut vastaavia tietoja, 5 muuttujaa (saraketta) 10000 havainnolla (rivillä), jotka haluan pienentää noin 100 tietoriville. Tiedot ovat aikakausisarjoja, mutta eivät jatkuvia, ja myös niitä voi olla eri paikoista, mikä tarkoittaa, että sinulla voi olla erilaisia tietoja samanaikaisesti (jos jälkimmäinen on ongelma estokäynnistyksen estämiseksi, voisin poistaa ”päällekkäiset” tiedot ajallaan). Esto-käynnistysvaihe antaisi mahdollisuuden kopioida tietojen korrelaatio.

Lopullisena tavoitteena on pienentää tietojoukko ~ 100 tietoriville siten, että sekä koko tietojoukon pdf että cdf ja pienennetty datajoukko ovat samat. (vielä määriteltävällä vähimmäisvirhealueella) kaikille viidelle muuttujalle.

Kysymys: 1) Voiko lohkon käynnistyksen tehdä tämä? 2) Mikä on vaiheittainen prosessi, joka tehdään? En odota, että kukaan kirjoittaa koko prosessin yksityiskohtaisesti tähän, mutta ehkä joku on laittanut sinne youtube-videon tai ”bootstrapping for dummies”, josta voisin aloittaa.

Olen tarkastellut samanlaisia kysymykset lohkon käynnistysvaiheesta täältä ja toisesta aiheesta ”Resurssit oppia lohkon käynnistyshihnasta aikasarjojen analyysissä”, mutta vastausten viitteissä oletetaan tilastollinen lukutaito, joka minun on vielä hallittava.

Kommentit

  • Entä tämä esittely ? Siinä on johdatus käynnistyshihnasta ja sitten lohkon käynnistysvyö.

vastaus

Aikasarjojen malliton uudelleennäytteistys suoritetaan lohkojen uudelleennäytteistämisellä, jota kutsutaan myös lohkon käynnistysvaiheeksi, joka voidaan toteuttaa käyttämällä tsboot-funktio R: n käynnistyspaketissa. Ajatuksena on jakaa sarja karkeasti yhtä pitkiksi lohkoiksi peräkkäisistä havainnoista, ottaa lohko näytteeksi korvaamalla ja liittää sitten lohkot yhteen hänen. Esimerkiksi, jos aikasarja on pituudeltaan 200 ja käytetään 10 lohkoa, joiden pituus on 20, lohkot ovat ensimmäiset 20 havaintoa, seuraavat 20 ja niin edelleen. Mahdollinen uudelleennäyte on neljäs lohko (havainto 61 – 80), sitten viimeinen lohko (havainto 181 – 200), sitten toinen lohko (havainto 21 – 40), sitten taas neljäs lohko ja niin edelleen, kunnes lohkoja on 10 näytteessä. Kuinka käynnistysseuranta tehdään aikasarjatiedoilla?

Kommentit

  • Mitä Economia selitti boostrappingista on oikein, mutta huomaa, että bootstrapped-näytettä ei käytetä pienentämään tietojoukkoa pienempään tietojoukkoon, jolla on sama taustajakauma. (jonka sanoit olevan tavoitteesi). Bootstrapping-toimintoa käytetään jonkin hypoteesin testaamiseen luomalla bootstrapped-näyte ja sitten katsomalla, mihin tilasto (testattava) kuuluu bootstrapped-näytteen empiiriseen jakautumiseen nähden. Joten tietojoukon pienentäminen pienemmäksi tietojoukoksi ei ole päällekkäisyyden tavoite. Sitä ' käytettiin hypoteesien testaamiseen mallivapaalla tavalla.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *