În RCT, randomizarea echilibrează confuzii nemăsurați și, mi se spune, ATE și ATT ar fi la fel. În studiile observaționale, acest lucru nu este posibil și Propensitatea Scorurile sunt utilizate în diferite moduri pentru a estima ATT și / sau ATE. Analizele pe care le-am „efectuat și exemple pe care le-am văzut” (de exemplu, acest text util ) arată ATT și ATE diferite (deși ușor).
Vă rog mă poate ajuta cineva să înțeleg de ce sunt diferite și, mai important, ce înseamnă diferențele (de exemplu, dacă ATE> ATT sau ATT> ATE), dacă ceva?
Răspuns
Efectul mediu al tratamentului ( ATE ) și Efectul tratamentului mediu asupra tratamentului ( ATT ) sunt definite în mod obișnuit pentru diferitele grupuri de persoane. În plus, ATE și ATT sunt adesea diferite, deoarece pot măsura rezultatele ($ Y $) care nu sunt afectate de tratament $ D $ în același mod.
Mai întâi , unele notații suplimentare:
- $ Y ^ 0 $: variabilă aleatorie la nivel de populație pentru rezultatul $ Y $ în starea de control.
- $ Y ^ 1 $: populație- variabilă aleatorie de nivel pentru rezultatul $ Y $ în starea de tratament.
- $ \ delta $: efect cauzal la nivel individual al tratamentului.
- $ \ pi $: proporția populației care ia tratament.
Având în vedere cele de mai sus, ATT este definit ca: $ \ mathrm {E} [\ delta | D = 1] $ ie. care este efectul cauzal așteptat al tratamentului pentru indivizii din grupul de tratament. Acest lucru poate fi descompus mai semnificativ ca: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Observați că $ \ mathrm {E} [Y ^ 0 | D = 1] $ nu este observat, deci se referă la o variabilă contrafactuală care nu este realizată în eșantionul nostru observat.) În mod similar, ATE este definit ca: $ \ mathrm {E} [\ delta] $, adică. care este efectul cauzal așteptat al tratamentului la toți indivizii din populație. Din nou, putem descompune acest lucru mai semnificativ ca: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
După cum vedeți ATT și mai general ATE se referă prin definiție la diferite porțiuni ale populației de interes. Mai important, în scenariul ideal al unui studiu de control randomizat ( RCT ) ATE este egal cu ATT deoarece presupunem că:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ și
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
adică. credem, respectiv, că:
- linia de bază a grupului de tratament este egală cu linia de bază a grupului de control (termeni laici: oamenii din grupul de tratament ar face la fel de rău ca grupul de control dacă nu au fost tratați) și
- efectul tratamentului asupra grupului tratat este egal cu efectul tratamentului asupra grupului de control (termeni laici: oamenii din grupul de control ar face la fel de bine ca grup de tratament dacă au fost tratați).
Acestea sunt ipoteze foarte puternice care sunt încălcate în mod obișnuit în studiile observaționale și, prin urmare, ATT și ATE nu se așteaptă să fie egale. (Observați că, dacă numai liniile de bază sunt egale, puteți obține un ATT prin diferențe simple: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Mai ales în cazurile în care indivizii se aleg în mod automat să intre în grupul de tratament sau nu (de exemplu, un magazin electronic care oferă bonus în numerar în care un client poate răscumpăra un cupon bonus pentru suma de $ X $, având în vedere că cumpără articole în valoare de cel puțin $ Y $), de bază, precum și efectele tratamentului pot fi diferite (de exemplu, cumpărătorii care repetă sunt mai susceptibili de a răscumpăra un astfel de bonus, clienții cu valoare redusă ar putea găsi pragul $ Y $ clienții nerealistic de mari sau cu valoare ridicată ar putea fi indiferenți la suma bonusului $ X $ – aceasta se referă și la SUTVA ). În astfel de scenarii, chiar și vorbirea despre ATE este probabil prost definită (de exemplu, este nerealist să ne așteptăm ca toți clienții unui magazin electronic să cumpere articole în valoare de $ Y $).
ATT fiind inegal cu ATE nu este neașteptat. Dacă ATT este mai mic sau mai mare decât ATE este specific aplicației. Inegalitatea celor două sugerează că mecanismul de atribuire a tratamentului nu a fost potențial aleatoriu. În general, într-un studiu observațional, deoarece ipotezele menționate mai sus nu sunt valabile în general, fie ne partiționăm eșantionul în consecință, fie controlăm diferența prin tehnici de tip „regresie”.
Pentru o expunere mai detaliată, dar ușor de urmărit, vă recomand să examinați Morgan & Winship „s .
Comentarii
- Vă mulțumesc foarte mult pentru acest răspuns incredibil de detaliat și de ajutor. I ' Nu sunt statistician și mă lupt uneori cu formule, dar acest lucru este foarte clar. Will Morga & Winship ' poate fi digerată de un laic sau puteți sugera un " manechin ' ghid " la inferența cauzală? Vă mulțumim din nou
- Mă bucur că aș putea ajuta. M-am educat în mare parte din lucrări, așa că am o viziune limitată a cărților de inferență cauzală care există acolo. Acestea fiind spuse, eu am găsit cartea M & W ' ca fiind clară și ușor de înțeles; cred că un profan înclinat va avea mici probleme de urmat. Cartea face parte din seria " Metode analitice pentru cercetări sociale " de la Cambridge Univ. Apăsați astfel încât să utilizeze în principal exemple bazate pe sociologie. @ DimitriyV.Masterov ar putea avea o sugestie mai educată.
- Mulțumesc, ' îmi voi primi o copie. " Inegalitatea celor două sugerează că mecanismul de atribuire a tratamentului nu a fost potențial aleatoriu. " Presupun într-o situație ipotetică în care literalmente fiecare linie de bază confounder a fost măsurat într-un studiu observațional și a existat o potrivire perfectă pentru fiecare PS, ne-am apropia foarte mult de aceste ipoteze. Prin urmare, măsura în care ATT / ATE sunt discordante ar oferi informații semnificative despre cât de slab s-a echilibrat PS-ul pentru confundanți nemăsurați?
- Într-o situație ipotetică , da. Cred că ar fi semnificativ în contextul unui studiu de simulare. Acestea fiind spuse, utilizarea efectivă a acestuia pentru a cuantifica " lipsa / bunătatea " a echilibrului realizat de PS este probabil un exercițiu metodic de sine stătător. (Citire fericită!)
- @bobmcpop Sunt ' m statistician și nu am înțeles niciodată de ce cineva ar vrea să măsoare ATT în loc de ATE. Este ' important să existe un grup de control care să țină cont de regresia la efectele medii & alți factori – tu ' lipsește acest lucru când utilizați ATT.
Răspuns
ATE este media efectul tratamentului, iar ATT este efectul mediu al tratamentului asupra tratamentului.
ATT este efectul tratamentului aplicat efectiv. Studiile medicale folosesc de obicei ATT ca cantitate de interes desemnată, deoarece deseori le pasă doar de efectul cauzal al medicamentelor pentru pacienții care primesc sau ar primi medicamente.
Pentru un alt exemplu, ATT ne spune cât de mult soldat tipic câștigat sau pierdut ca o consecință a serviciului militar, în timp ce ATE ne spune cât de mult a câștigat sau a pierdut solicitantul tipic pentru armată.
Comentarii
- ' confundați ATT cu efectul ITT, intenție de tratare.
- Nu ' nu confund. Mă refer la această lucrare: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Potrivirea ca preprocesare nonparametrică pentru reducerea dependenței modelului în inferența cauzală parametrică. Analiză politică, 15 (3), 199-236.
- Ai ' dreptate, am înțeles greșit.
- Acesta este unul dintre cele mai clare explicații pe care le-am văzut despre ATE vs ATT