Varför skiljer sig den genomsnittliga behandlingseffekten från den genomsnittliga behandlingseffekten på den behandlade?

I RCT balanserar randomisering omätade confounders och jag sa, ATE och ATT skulle vara desamma. I observationsstudier är det inte möjligt och benägenhet Poäng används på olika sätt för att uppskatta ATT och / eller ATE. Analyserna som jag har utfört och exempel som jag har sett (t.ex. denna hjälpsamma text ) visar olika ATT och ATE (om än något).

Snälla kan någon hjälpa mig att förstå varför de är olika och, ännu viktigare, vad skillnaderna betyder (t.ex. om ATE> ATT eller ATT> ATE), om något?

Svar

Genomsnittlig behandlingseffekt ( ATE ) och Genomsnittlig behandlingseffekt på behandlade ( ATT ) definieras vanligtvis i olika grupper av individer. Dessutom ATE och ATT är ofta olika eftersom de kan mäta utfall ($ Y $) som inte påverkas av behandlingen $ D $ på samma sätt.

Först , ytterligare information:

  • $ Y ^ 0 $: slumpmässig variabel på befolkningsnivå för utfallet $ Y $ i kontrolltillstånd.
  • $ Y ^ 1 $: population- slumpmässig variabel för resultat $ Y $ i behandlingstillstånd.
  • $ \ delta $: kausal effekt på individnivå av behandlingen.
  • $ \ pi $: andel av befolkningen som tar behandling.

Med tanke på ovanstående definieras ATT som: $ \ mathrm {E} [\ delta | D = 1] $ ie. vad är den förväntade orsakseffekten av behandlingen för individer i behandlingsgruppen. Detta kan sönderdelas mer meningsfullt som: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}

(Observera att $ \ mathrm {E} [Y ^ 0 | D = 1] $ är obemärkt så det hänvisar till en kontrafaktisk variabel som inte realiseras i vårt observerade urval.) På samma sätt definieras ATE som: $ \ mathrm {E} [\ delta] $, dvs. vad är den förväntade orsakseffekten av behandlingen för alla individer i befolkningen. Återigen kan vi sönderdela detta mer meningsfullt som: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}

Som du ser ATT och den mer generella ATE hänvisar per definition till olika delar av befolkningen av intresse. Ännu viktigare, i det ideala scenariot för en randomiserad kontrollstudie ( RCT ) ATE är lika med ATT eftersom vi antar att:

  • $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ och
  • $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,

dvs. Vi tror att:

  • behandlingsgruppens baslinje är lika med basgruppen för kontrollgruppen (lekmannstermer: människor i behandlingsgruppen skulle göra så dåligt som kontrollgruppen om de inte behandlades) och
  • behandlingseffekten på den behandlade gruppen är lika med behandlingseffekten på kontrollgruppen (lekmannstermer: människor i kontrollgruppen skulle göra som bra som behandlingsgrupp om de behandlades).

Detta är mycket starka antaganden som ofta bryts mot observationsstudier och därför ATT och ATE förväntas inte vara lika. (Observera att om bara baslinjerna är lika kan du fortfarande få en ATT genom enkla skillnader: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)

Särskilt i de fall där individerna själv väljer att gå in i behandlingsgruppen eller inte (t.ex. en e-butik som ger kontantbonus där en kund kan lösa in en bonuskupong för $ X $ -belopp med tanke på att hon handlar varor värda minst $ Y $ -belopp) baslinjerna och behandlingseffekterna kan vara olika (t.ex. att återkommande köpare är mer benägna att lösa in en sådan bonus, kan kunder med lågt värde tröskeln $ Y $ orealistiskt höga eller högt värderade kunder kan vara likgiltiga med bonusbeloppet $ X $ – detta gäller också SUTVA ). I sådana scenarier är det till och med otydligt att prata om ATE (t.ex. det är orealistiskt att förvänta sig att alla kunder i en e-butik någonsin kommer att handla varor till ett värde av $ Y $).

ATT att vara ojämlik med ATE är inte oväntat. Om ATT är mindre eller större än ATE är applikationsspecifikt. Ojämlikheten mellan de två antyder att mekanismen för behandlingstilldelning potentiellt inte var slumpmässig. I allmänhet, i en observationsstudie eftersom de ovan nämnda antagandena vanligtvis inte håller, delar vi antingen vårt urval därefter eller så kontrollerar vi för skillnad genom ”regressionsliknande” tekniker.

För en mer detaljerad men lätt att följa redogörelsen för saken rekommenderar jag att du tittar på Morgan & Winship ”s Counterfactuals and Causal Inference .

Kommentarer

  • Tack så mycket för detta otroligt detaljerade och hjälpsamma svar. Jag ' jag är inte statistiker och kämpar ibland med formler, men detta är mycket tydligt. Kommer Morga & Winship ' s bok kan smältas av en lekman, eller kan du föreslå en " dummy ' s guide " till kausal inferens? Tack igen
  • Jag är glad att jag kan hjälpa till. Jag har utbildat mig mest från papper så jag har en begränsad bild av vilka kausala inferensböcker som finns där. har hittat M & W ' s bok är tydlig och lätt att förstå. Jag tror att en lutande lekman kommer att ha små problem att följa igenom. Boken är en del av " Analytical Methods for Social Research " -serien från Cambridge Univ. Tryck så det använder mest sociologibaserade exempel. @ DimitriyV.Masterov kan ha ett mer utbildat förslag.
  • Tack, jag ' Jag skaffar mig en kopia. " Ojämlikheten mellan de två antyder att behandlingsmekanismen potentiellt inte var slumpmässig. " Jag antar i en hypotetisk situation där bokstavligen varje confounder mättes i en observationsstudie, och det fanns en perfekt matchning för varje PS, vi skulle komma mycket nära dessa antaganden. Därför skulle i vilken utsträckning ATT / ATE är överensstämmande ge någon meningsfull information om hur dåligt PS balanserade för obestämda förvirrare?
  • I en hypotetisk situation, ja. Jag tror att det skulle vara meningsfullt i samband med en simuleringsstudie. Med detta sagt är det faktiskt att man använder det för att kvantifiera " dålighet / godhet " av balans som uppnås av PS en metodisk övning i sig. (Lycklig läsning!)
  • @bobmcpop Jag ' Jag är statistiker, och jag har aldrig förstått varför någon skulle vilja mäta ATT istället för ATE. Det är ' viktigt att ha en kontrollgrupp för att ta hänsyn till regression till medeleffekterna & andra faktorer – du ' saknar detta när du använder ATT.

Svar

ATE är genomsnittet behandlingseffekt och ATT är den genomsnittliga behandlingseffekten på de behandlade.

ATT är effekten av den behandling som faktiskt tillämpats. Medicinska studier använder vanligtvis ATT som angiven mängd intresse eftersom de ofta bara bryr sig om orsakseffekten av läkemedel för patienter som får eller skulle få drogen.

För ett annat exempel berättar ATT hur mycket typisk soldat som förvärvats eller förlorats till följd av militärtjänst, medan ATE berättar för oss hur mycket den typiska sökanden för militären har vunnit eller förlorat.

Kommentarer

  • Du ' förvirrar ATT med ITT, avsikt att behandla effekten.
  • Jag förvirrar inte '. Jag hänvisar till denna uppsats: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matchning som icke-parametrisk förbehandling för att minska modellberoende i parametrisk kausal inferens. Politisk analys, 15 (3), 199-236.
  • Du ' har rätt, jag missförstod det.
  • Detta är en av tydligaste förklaringar jag har sett om ATE vs ATT

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *