Mă străduiesc să înțeleg conceptul de varianță asimptotică. Contextul este procesarea geofizică a seriilor temporale cu metode robuste.
Metodele cu un punct de defalcare foarte ridicat au de obicei o eficiență relativă asimptotică mai mică la distribuția Gaussiană decât LS. Aceasta înseamnă că, cu cât este mai mare robustețea estimatorului, cu atât este mai mare varianța asimptotică. Pentru a obține aceleași incertitudini legate de parametri prin procedura robustă, sunt necesare mai multe măsurători.
Poate cineva să explice acest lucru?
Comentarii
- Nu este clar care este confuzia dvs. cu privire la " varianță asimptotică " per say. Pari să fii confuz de conceptul de eficiență relativă asimptotică, nu de varianță asimptotică.
- @Bey, cele două sunt strâns legate, deoarece A.R.E. este un raport al varianțelor asimptotice. (De asemenea, cred că vrei să spui " în sine " acolo.)
- @Glen_b da, vreau să spun în sine și da, sunt foarte înrudite, dar, desigur, pe terenul de origine al metodelor bazate pe gaussian, non-robuste, robuste metodele necesită mai multe probe. Am vrut să clarific ce a fost contra-intuitiv despre acest lucru, dar văd că există un răspuns acceptat, așa că am reușit să ajung la această problemă.
- Eficiență relativă asimptotică .
Răspuns
Un estimator robust este cel care este neschimbat sau se modifică foarte puțin atunci când se introduc date noi sau se încalcă ipotezele. De exemplu, mediana este un estimator mai robust decât media, deoarece dacă adăugați o observație relativ mare la setul de date, mediana dvs. se va schimba foarte puțin, în timp ce media dvs. se va schimba mult mai mult.
Când montați o modelul de regresie liniară, obținem estimări ale parametrilor și erori standard asociate estimărilor noastre. Una dintre ipotezele modelului de regresie liniară este egalitatea de varianță – adică, indiferent de valoarea $ x $, erorile vor fi distribuite cu media $ 0 $ și deviația standard $ \ sigma $. În cazul în care această ipoteză este încălcată, este posibil să preferăm să utilizăm erori standard robuste care sunt în general erori standard mai mari, care vor explica orice încălcare a ipotezei noastre de egalitate de variații. (Această încălcare este cunoscută sub numele de heteroscedasticitate.)
Când folosim erori standard robuste, erorile noastre standard (și echivalent, variațiile noastre) sunt în general mai mari decât ar fi dacă nu am face „nu utilizați erori standard robuste. Să denotăm eroarea standard robustă ca $ \ frac {\ sigma_R} {\ sqrt {n}} $ și eroarea standard„ tipică ”(non-robustă) ca $ \ frac {\ sigma_T } {\ sqrt {n}} $. Ar trebui să fie clar că, atunci când eroarea standard robustă este mai mare, $ \ frac {\ sigma_R} {\ sqrt {n}} > \ frac {\ sigma_T} {\ sqrt { n}} $. De asemenea, ar trebui să fie clar că, asimptotic, eroarea standard robustă va fi mai mare decât eroarea standard „tipică”, deoarece putem anula $ \ sqrt {n} $ din ambele părți.
Let ”s spuneți că eroarea noastră standard „tipică” este $ k = \ frac {\ sigma_T} {\ sqrt {n}} $. Apoi $ k < \ frac {\ sigma_R} {\ sqrt {n}} $. Pentru ca eroarea standard robustă să fie egală cu $ k $, trebuie să facem $ n $ mai mare (adică să colectăm mai multe observații / eșantion).
Sper că acest lucru are sens!
EDIT: Consultați linkul inclus și comentariile de mai jos pentru o scurtă discuție despre când vor apărea erorile standard robuste de fapt să fie mai mare decât erorile standard „tipice” (non-robuste). http://chrisauld.com/2012/10/31/the-intuition-of-robust-standard-errors/
Comentarii
- Este posibil să construim cazuri în care erorile standard robuste sunt de fapt mai mici decât cele standard!
- Christoph, voi edita răspuns adecvat . ' mă interesează să știu când un $ \ sigma $ mai mare se corelează cu un $ mai mic (x_i- \ bar {x}) $ deoarece pare contraintuitiv și, deși nu este imposibil, extrem de improbabil. Se pare că implicați la fel de mult în răspunsul dvs. – că este posibil să construiți un caz astfel încât acest lucru să se întâmple – dar ar fi interesant să vedeți cât de des apare acest lucru în date reale și nu în cazuri patologice.