Blocca il bootstrap per un principiante

Per contestualizzare la mia domanda, sono un fisico ma con unesposizione limitata alle statistiche e ciò che ho imparato su di esse è superiore ai 30 anni anni fa.

Sto cercando di imparare il bootstrap dei blocchi poiché questa tecnica potrebbe essere adatta per risolvere un problema su cui sto lavorando. Riesco a trovare molti documenti / libri / informazioni sulla matematica del bootstrap a blocchi, ma vorrei prima trovare una descrizione generica del processo di bootstrap prima di “avventurarmi” in questioni come lo spostamento di bootstrap a blocchi, bootstrap a blocchi circolari, bootstrap a blocchi stazionari , blocklengths, samplesize, ecc.

Ho sovracampionato i dati correlati, 5 variabili (colonne) per 10000 osservazioni (righe) che voglio ridurre a circa 100 righe di dati. I dati sono una serie temporale, ma non continua e potrebbero esserci anche dati provenienti da posizioni diverse, il che significa che puoi avere dati diversi contemporaneamente (se questultimo è un problema per il bootstrap dei blocchi, potrei rimuovere i dati “duplicati” in tempo). Il blocco del bootstrap consentirebbe di replicare la correlazione dei dati.

Lobiettivo finale è ridurre il set di dati a ~ 100 righe di dati in modo che sia il pdf che il cdf del set di dati completo e il set di dati ridotto siano gli stessi (entro un intervallo di errore minimo ancora da definire) per tutte e 5 le variabili.

Domanda: 1) Il bootstrap a blocchi sarà in grado di farlo? 2) Qual è il processo graduale che viene eseguito? Non mi aspetto che qualcuno scriva lintero processo in dettaglio qui, ma forse qualcuno ha messo là fuori un video di YouTube o un “bootstrap per manichini” con cui potrei iniziare.

Ho visto simili domande sul bootstrap dei blocchi qui e ce nè una su “Risorse per apprendere il bootstrap dei blocchi nellanalisi delle serie temporali”, ma i riferimenti nelle risposte presuppongono unalfabetizzazione statistica che devo ancora padroneggiare.

Commenti

Answer

Il ricampionamento senza modello delle serie temporali viene ottenuto mediante ricampionamento dei blocchi, chiamato anche bootstrap dei blocchi, che può essere implementato utilizzando il tsboot nel pacchetto di avvio di R. Lidea è di suddividere la serie in blocchi di lunghezza approssimativamente uguale di osservazioni consecutive, ricampionare il blocco con la sostituzione e quindi incollare i blocchi insieme sua. Ad esempio, se la serie temporale è di lunghezza 200 e si utilizzano 10 blocchi di lunghezza 20, i blocchi sono le prime 20 osservazioni, le successive 20 e così via. Un possibile ricampionamento è il quarto blocco (osservazione da 61 a 80), quindi lultimo blocco (osservazione da 181 a 200), quindi il secondo blocco (osservazione da 21 a 40), quindi di nuovo il quarto blocco e così via fino a quando non ci sono 10 blocchi nel ricampionamento. Come si esegue il bootstrap con i dati delle serie temporali?

Commenti

  • Cosa Leconomia spiegata sul boostrapping è corretta ma si noti che il campione bootstrap non viene utilizzato per ridurre un set di dati a un set di dati più piccolo con la stessa distribuzione sottostante. (che hai detto era il tuo obiettivo). Il bootstrap viene utilizzato per testare alcune ipotesi creando il campione bootstrap e quindi vedere dove cade la statistica (quella che viene testata) rispetto alla distribuzione empirica del campione bootstrap. Quindi, la riduzione di un set di dati a un set di dati più piccolo non è lobiettivo del bstrapping. ' viene utilizzato per testare le ipotesi in modo privo di modelli.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *