Hvorfor er gjennomsnittlig behandlingseffekt forskjellig fra gjennomsnittlig behandlingseffekt på behandlet?

I RCTs balanserer randomisering ikke-målte sammenblandere, og jeg sa, ATE og ATT ville være det samme. I observasjonsstudier er dette ikke mulig og tilbøyelighet Poeng blir brukt på forskjellige måter for å estimere ATT og / eller ATE. Analysene jeg har utført og eksempler som jeg har sett (f.eks. Denne nyttige tekst ) viser forskjellige ATT og ATE (om enn litt).

Vennligst kan noen hjelpe meg med å forstå hvorfor de er forskjellige, og enda viktigere, hva forskjellene betyr (f.eks. hvis ATE> ATT eller ATT> ATE), hvis noe?

Svar

Gjennomsnittlig behandlingseffekt ( ATE ) og Gjennomsnittlig behandlingseffekt på behandlet ( ATT ) defineres ofte på tvers av de forskjellige gruppene av individer. I tillegg ATE og ATT er ofte forskjellige fordi de kan måle utfall ($ Y $) som ikke påvirkes av behandlingen $ D $ på samme måte.

Først , noen tilleggsmerknader:

  • $ Y ^ 0 $: tilfeldig variabel på populasjonsnivå for utfallet $ Y $ i kontrolltilstand.
  • $ Y ^ 1 $: populasjons- nivå tilfeldig variabel for utfall $ Y $ i behandlingstilstand.
  • $ \ delta $: kausal effekt på individnivå av behandlingen.
  • $ \ pi $: andel av befolkningen som tar behandling.

Gitt ovenstående er ATT definert som: $ \ mathrm {E} [\ delta | D = 1] $ ie. hva er den forventede årsakseffekten av behandlingen for personer i behandlingsgruppen. Dette kan dekomponeres mer meningsfullt som: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}

(Legg merke til at $ \ mathrm {E} [Y ^ 0 | D = 1] $ ikke er observert, så det refererer til en kontrafaktisk variabel som ikke blir realisert i vårt observerte utvalg.) Tilsvarende er ATE definert som: $ \ mathrm {E} [\ delta] $, dvs. hva er den forventede årsakseffekten av behandlingen på tvers av alle individer i befolkningen. Igjen kan vi dekomponere dette mer meningsfullt som: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}

Som du ser ATT og den mer generelle ATE refererer per definisjon til forskjellige deler av befolkningen av interesse. Enda viktigere, i det ideelle scenariet for en randomisert kontrollforsøk ( RCT ) ATE tilsvarer ATT fordi vi antar at:

  • $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ og
  • $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,

dvs. vi har henholdsvis tro på at:

  • behandlingsgruppens baseline er lik kontrollgruppens baseline (lekmannsbetegnelser: mennesker i behandlingsgruppen ville gjøre det som dårlig som kontrollgruppen hvis de ikke ble behandlet) og
  • behandlingseffekten på den behandlede gruppen er lik behandlingseffekten på kontrollgruppen (lekmannstegn: mennesker i kontrollgruppen ville gjøre som bra som behandlingsgruppen hvis de ble behandlet).

Dette er veldig sterke forutsetninger som ofte brytes i observasjonsstudier og derfor ATT og ATE forventes ikke å være like. (Merk at hvis bare grunnlinjene er like, kan du fremdeles få en ATT gjennom enkle forskjeller: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)

Spesielt i tilfeller der individene selv velger å gå inn i behandlingsgruppen eller ikke (f.eks. En e-butikk som gir kontantbonus der en kunde kan løse inn en bonuskupong for $ X $ -beløp gitt at hun handler varer verdt minst $ Y $ -beløp) basislinjene så vel som behandlingseffektene kan være forskjellige (f.eks. gjentatte kjøpere er mer sannsynlig å innløse en slik bonus, kunder med lav verdi kan finne terskelen $ Y $ urealistisk høye eller høyverdige kunder kan være likegyldige med bonusbeløpet $ X $ – dette gjelder også SUTVA ). I scenarier som dette er det til og med dårlig definert å snakke om ATE (f.eks. Det er urealistisk å forvente at alle kundene i en e-butikk noensinne vil handle varer verdt $ Y $).

ATT å være ulik ATE er ikke uventet. Hvis ATT er mindre eller større enn ATE er applikasjonsspesifikk. Ulikheten mellom de to antyder at behandlingsoppdelingsmekanismen potensielt ikke var tilfeldig. Generelt, i en observasjonsstudie fordi de ovennevnte antakelsene generelt ikke holder, deler vi enten utvalget vårt tilsvarende, eller vi kontrollerer for forskjell gjennom «regresjonslignende» teknikker.

For en mer detaljert, men lett å følge redegjørelsen for saken, anbefaler jeg å se på Morgan & Winship «s Counterfactuals and Causal Inference .

Kommentarer

  • Tusen takk for dette utrolig detaljerte og hjelpsomme svaret. Jeg ' Jeg er ikke statistiker og sliter til tider med formler, men dette er veldig tydelig. Vil Morga & Winship ' s bok kan fordøyes av en lekmann, eller kan du foreslå en " dummy ' s guide " til årsaksslutning? Takk igjen
  • Jeg er glad jeg kunne hjelpe. Jeg har utdannet meg mest fra papirer, så jeg har et begrenset syn på hvilke årsaksbaserte bøker som er der ute. Når det er sagt, jeg har funnet M & W ' s bok er tydelig og lett å forstå; jeg tror en tilbøyelig lekmann vil ha små problemer å følge med på. Boken er en del av " Analytical Methods for Social Research " -serien fra Cambridge Univ. Trykk så den bruker mest sosiologibaserte eksempler. @ DimitriyV.Masterov kan ha et mer utdannet forslag.
  • Takk, jeg ' Jeg skaffer meg en kopi. " Ulikheten mellom de to antyder at behandlingsoppgavemekanismen potensielt ikke var tilfeldig. " Jeg antar i en hypotetisk situasjon der bokstavelig talt hver grunnlinje confounder ble målt i en observasjonsstudie, og det var en perfekt match for hver PS, vi ville komme veldig nær disse antagelsene. Derfor ville i hvilken grad ATT / ATE er uoverensstemmende gi noen meningsfylt informasjon om hvor dårlig PS balanserte for umålte forvirrende?
  • I en hypotetisk situasjon, ja. Jeg tror det ville være meningsfylt i sammenheng med en simuleringsstudie. Når det er sagt, er faktisk bruk av den til å kvantifisere " dårlighet / godhet " balanse oppnådd av PS sannsynligvis en metodisk øvelse på egen hånd. (Glad lesning!)
  • @bobmcpop Jeg ' er statistiker, og jeg har aldri forstått hvorfor noen vil måle ATT i stedet for ATE. Det ' er viktig å ha en kontrollgruppe for å gjøre rede for regresjon til middeleffekten & andre faktorer – du ' mangler dette når du bruker ATT.

Svar

ATE er gjennomsnittet behandlingseffekt, og ATT er den gjennomsnittlige behandlingseffekten på de behandlede.

ATT er effekten av den faktisk anvendte behandlingen. Medisinske studier bruker vanligvis ATT som den angitte mengden av interesse fordi de ofte bare bryr seg om årsakseffekten av medisiner for pasienter som får eller vil motta stoffene.

For et annet eksempel forteller ATT oss hvor mye typisk soldat oppnådd eller tapt som følge av militærtjeneste, mens ATE forteller oss hvor mye den typiske søkeren til militæret fikk eller tapte.

Kommentarer

  • Du ' forvirrer ATT med ITT, hensikt å behandle effekten.
  • Jeg forvirrer ikke '. Jeg viser til dette papiret: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matching som ikke-parametrisk forbehandling for å redusere modellavhengighet i parametrisk årsaksslutning. Politisk analyse, 15 (3), 199-236.
  • Du ' har rett, jeg misforsto.
  • Dette er en av klareste forklaringer jeg har sett på ATE vs ATT

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *