Letiltja a kezdőpántot egy kezdő számára

A kérdésem kontextusba helyezéséhez fizikus vagyok, de korlátozott a statisztikáknak való kitettség, és mit tudtam róla, több mint 30 évekkel ezelőtt.

Megpróbálok többet megtudni a blokkindításról, mivel ez a technika alkalmas lehet egy olyan probléma megoldására, amin dolgozom. Számos papírt / könyvet / információt találok a blokkbetöltés matematikájáról, de előbb szeretnék találni egy általános leírást a blokkbetöltési folyamatról, mielőtt “belemerülnék” olyan kérdésekbe, mint a blokkbetöltés indítása, körkörös blokkbetöltés, stacionárius blokkbetöltés , blokkhosszak, mintavételezés stb.

Túlzott mintát vettem a korrelált adatokból, 5 változóból (oszlopból) 10000 megfigyeléssel (sor), amelyeket körülbelül 100 adatsorra szeretnék csökkenteni. Az adatok idősorozatok, de nem folyamatosak, és előfordulhat, hogy különböző helyekről is vannak adatok, ami azt jelenti, hogy egyszerre különböző adatokkal rendelkezhet (ha ez utóbbi a blokkolt rendszerindítás problémája, akkor eltávolíthatnám az “ismétlődő” adatokat időben). A rendszerindítás blokkolása lehetővé tenné az adatok korrelációjának megismétlését.

A végső cél az adatkészlet ~ 100 adatsorra való csökkentése, hogy a teljes adatkészlet pdf és cdf, valamint a redukált adatkészlet egyaránt megegyezzen (a még megadandó minimális hibatartományon belül) mind az 5 változó esetében.

Kérdés: 1) A blokkolt rendszerindítás képes lesz erre? 2) Mi az a lépésről lépésre végrehajtott folyamat? Nem számítok arra, hogy bárki itt részletesen leírja a teljes folyamatot, de lehet, hogy valaki feltett egy youtube-videót vagy egy “bootstrapping for dummies” -ot, amellyel kezdhettem.

Megnéztem hasonlóakat a blokk-indítással kapcsolatos kérdések itt és itt vannak a “Források a blokk-indítópánt megismeréséhez az idősor-elemzésben” témakörben, de a válaszokban szereplő hivatkozások olyan statisztikai műveltséget feltételeznek, amelyet még el kell sajátítanom.

Válasz

Az idősorok modell nélküli újramintavételét blokk-újramintavétellel, más néven blokkbetöltéssel hajtjuk végre, amely a tsboot függvény az R rendszerindító csomagjában. Az ötlet az, hogy a sorozatot nagyjából azonos hosszúságú szakaszokra bontjuk az egymást követő megfigyelésekből, a blokkból mintát cserélünk, majd a blokkokat illesztjük neki. Például, ha az idősor 200 hosszú, és az egyik 10 20 hosszúságú blokkot használ, akkor a blokkok az első 20 megfigyelés, a következő 20 és így tovább. Egy lehetséges újraminta a negyedik blokk (61–80. Megfigyelés), majd az utolsó blokk (181. – 200. Megfigyelés), majd a második blokk (21–40. Megfigyelés), majd a negyedik blokk ismét, és így tovább, amíg 10 blokk nem lesz. az újra mintában. Hogyan kell végrehajtani az idősor adataival történő indítást?

Megjegyzések

  • Mi A boostrappingről a Economia magyarázata helyes, de vegye figyelembe, hogy a bootstrapped mintát nem arra használják, hogy egy adathalmazt kisebb adathalmazsá redukáljon, ugyanazzal az alapelosztással. (amiről azt mondtad, hogy a célod volt). A rendszerindítást néhány hipotézis tesztelésére használják a rendszerindító minta létrehozásával, majd annak megnézésével, hogy a statisztika (a tesztelés alatt álló) hova esik a rendszerindító minta empirikus eloszlásához képest. Tehát az adatkészlet kisebb adathalmazra való csökkentése nem a bstrapping célja. ' s a hipotézisek modell nélküli tesztelésére használták.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük