I RCTer balancerer randomisering ikke-målte confounders, og jeg sagde, ATE og ATT ville være den samme. I observationsstudier er dette ikke muligt, og tilbøjelighed Resultater bruges på forskellige måder til at estimere ATT og / eller ATE. Analyserne, som jeg har udført, og eksempler, som jeg har set (f.eks. Denne nyttige tekst ) viser forskellige ATT og ATE (om end lidt).
Kan nogen hjælpe mig med at forstå, hvorfor de er forskellige, og vigtigere, hvad forskellene betyder (f.eks. hvis ATE> ATT eller ATT> ATE), hvis noget?
Svar
Den gennemsnitlige behandlingseffekt ( ATE ) og Gennemsnitlig behandlingseffekt på behandlet ( ATT ) defineres almindeligvis på tværs af de forskellige grupper af individer. Derudover ATE og ATT er ofte forskellige, fordi de måske måler resultater ($ Y $), der ikke påvirkes af behandlingen $ D $ på samme måde.
Først , en vis yderligere notation:
- $ Y ^ 0 $: tilfældig variabel på befolkningsniveau for resultatet $ Y $ i kontroltilstand.
- $ Y ^ 1 $: population- niveau tilfældig variabel for resultat $ Y $ i behandlingstilstand.
- $ \ delta $: kausal effekt på individuelt niveau af behandlingen.
- $ \ pi $: andel af befolkningen, der tager behandling.
I betragtning af ovenstående defineres ATT som: $ \ mathrm {E} [\ delta | D = 1] $ ie. hvad er den forventede årsagseffekt af behandlingen for personer i behandlingsgruppen. Dette kan nedbrydes mere meningsfuldt som: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Bemærk, at $ \ mathrm {E} [Y ^ 0 | D = 1] $ ikke er observeret, så det refererer til en kontrafaktisk variabel, som ikke realiseres i vores observerede prøve.) Tilsvarende er ATE defineret som: $ \ mathrm {E} [\ delta] $, dvs. hvad er den forventede årsagseffekt af behandlingen på tværs af alle individer i befolkningen. Igen kan vi nedbryde dette mere meningsfuldt som: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Som du ser ATT og den mere generelle ATE henviser pr. definition til forskellige dele af befolkningen af interesse. Endnu vigtigere, i det ideelle scenarie for et randomiseret kontrolforsøg ( RCT ) ATE er lig med ATT fordi vi antager, at:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ og
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
dvs. vi har henholdsvis tro på, at:
- behandlingsgruppens basislinie er lig med kontrolgruppens basislinje (lægmandssætninger: mennesker i behandlingsgruppen ville gøre det som dårligt som kontrolgruppen, hvis de ikke blev behandlet) og
- behandlingseffekten på den behandlede gruppe er lig med behandlingseffekten på kontrolgruppen (lægmæssige udtryk: mennesker i kontrolgruppen ville gøre som godt som behandlingsgruppen, hvis de blev behandlet).
Dette er meget stærke antagelser, som ofte overtrædes i observationsstudier og derfor ATT og ATE forventes ikke at være ens. (Bemærk, at hvis kun basislinjerne er ens, kan du stadig få en ATT gennem enkle forskelle: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Især i de tilfælde, hvor enkeltpersoner selv vælger at gå ind i behandlingsgruppen eller ej (f.eks. En e-shop, der giver kontantbonus, hvor en kunde kan indløse en bonuskupon til $ X $ -beløb, forudsat at hun handler varer til mindst $ Y $ -beløb) basislinjerne samt behandlingseffekterne kan være forskellige (f.eks. gentagne købere er mere tilbøjelige til at indløse en sådan bonus, kunder med lav værdi kan finde tærsklen $ Y $ urealistisk høje eller værdifulde kunder kan være ligeglade med bonusbeløbet $ X $ – dette vedrører også SUTVA ). I scenarier som dette er det sandsynligvis dårligt defineret at tale om ATE (f.eks. Det er urealistisk at forvente, at alle kunder i en e-shop nogensinde vil handle varer til en værdi af $ Y $).
ATT at være ulig ATE er ikke uventet. Hvis ATT er mindre eller større end ATE er applikationsspecifik. Uligheden mellem de to antyder, at mekanismen for tildeling af behandling potentielt ikke var tilfældig. Generelt i en observationsundersøgelse, fordi de ovennævnte antagelser generelt ikke holder, opdeler vi enten vores prøve i overensstemmelse hermed, eller vi kontrollerer for forskel gennem “regressionslignende” teknikker.
For en mere detaljeret, men let at følge redegørelse for sagen, anbefaler jeg at se på Morgan & Winship “s Counterfactuals and Causal Inference .
Kommentarer
- Mange tak for dette utroligt detaljerede og hjælpsomme svar. Jeg ' Jeg er ikke statistiker og kæmper til tider med formler, men dette er meget klart. Vil Morga & Winship ' s bog kan fordøjes af en lægmand, eller kan du foreslå en " dummy ' s guide " til kausal inferens? Tak igen
- Jeg er glad for, at jeg kunne hjælpe. Jeg har mest uddannet mig selv fra papirer, så jeg har et begrænset overblik over, hvilke kausale inferensbøger der er der. Når det er sagt, jeg har fundet M & W ' s bog for at være klar og let at forstå; jeg tror en tilbøjelig lægmand vil have små problemer at følge igennem. Bogen er en del af " Analytiske metoder til social forskning " -serien fra Cambridge Univ. Tryk, så det bruger mest sociologiske baserede eksempler. @ DimitriyV.Masterov har måske et mere veluddannet forslag.
- Tak, jeg ' Jeg får mig en kopi. " Uligheden mellem de to antyder, at mekanismen for behandlingstildeling potentielt ikke var tilfældig. " Jeg antager i en hypotetisk situation, hvor bogstaveligt talt hver baseline confounder blev målt i en observationsundersøgelse, og der var et perfekt match for hver PS, vi ville komme meget tæt på disse antagelser. Derfor vil det omfang, hvor ATT / ATE er uoverensstemmende, give nogen meningsfuld information om, hvor dårligt PS er afbalanceret for ikke-målte forvirrende?
- I en hypotetisk situation, ja. Jeg tror, det ville være meningsfuldt i sammenhæng med en simuleringsundersøgelse. Når det er sagt, er faktisk brug af det til at kvantificere " dårlighed / godhed " balance opnået af PS sandsynligvis en metodisk øvelse i sig selv. (Glad læsning!)
- @bobmcpop Jeg ' er statistiker, og jeg har aldrig forstået, hvorfor nogen vil måle ATT i stedet for ATE. Det er ' vigtigt at have en kontrolgruppe til at tage højde for regression til de gennemsnitlige effekter & andre faktorer – du ' mangler dette, når du bruger ATT.
Svar
ATE er gennemsnittet behandlingseffekt, og ATT er den gennemsnitlige behandlingseffekt på de behandlede.
ATT er effekten af den faktisk anvendte behandling. Medicinske undersøgelser bruger typisk ATT som den angivne mængde af interesse, fordi de ofte kun bekymrer sig om årsagseffekten af lægemidler for patienter, der modtager eller vil modtage stofferne.
For et andet eksempel fortæller ATT os, hvor meget typisk soldat vundet eller tabt som følge af militærtjeneste, mens ATE fortæller os, hvor meget den typiske ansøger til militæret vandt eller tabte.
Kommentarer
- Du ' forvirrer ATT med ITT, intention-to-treat-effekten.
- Jeg forvirrer ikke '. Jeg henviser til dette papir: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matching som ikke-parametrisk forbehandling til reduktion af modelafhængighed ved parametrisk årsagsslutning. Politisk analyse, 15 (3), 199-236.
- Du ' har ret, jeg misforstod.
- Dette er en af de klareste forklaringer, jeg har set på ATE vs ATT