In RCTs balanceert randomisatie niet-gemeten confounders en, zo heb ik gezegd, ATE en ATT zouden hetzelfde zijn. In observationele studies is dit niet mogelijk en Propensity Scores worden op verschillende manieren gebruikt om ATT en / of ATE te schatten. De analyses die ik heb uitgevoerd en voorbeelden die ik heb gezien (bijv. Deze nuttige tekst ) toont verschillende ATT en ATE (zij het enigszins).
Kan iemand me alsjeblieft helpen begrijpen waarom ze anders zijn en, nog belangrijker, wat de verschillen betekenen (bijv. als ATE> ATT of ATT> ATE), als iets?
Antwoord
Het gemiddelde behandelingseffect ( ATE ) en het gemiddelde behandelingseffect op behandeld ( ATT ) worden doorgaans gedefinieerd voor de verschillende groepen individuen. Bovendien worden ATE en ATT zijn vaak verschillend omdat ze resultaten ($ Y $) kunnen meten die niet op dezelfde manier worden beïnvloed door de behandeling $ D $.
Ten eerste , wat extra notatie:
- $ Y ^ 0 $: willekeurige variabele op populatieniveau voor uitkomst $ Y $ in controlestatus.
- $ Y ^ 1 $: populatie- willekeurige variabele voor uitkomst $ Y $ in behandelingsstatus.
- $ \ delta $: causaal effect op individueel niveau van de behandeling.
- $ \ pi $: deel van de bevolking dat behandeling.
Gezien het bovenstaande wordt de ATT gedefinieerd als: $ \ mathrm {E} [\ delta | D = 1] $ ie. wat is het verwachte causale effect van de behandeling voor individuen in de behandelde groep. Dit kan zinvoller worden ontleed als: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Merk op dat $ \ mathrm {E} [Y ^ 0 | D = 1] $ niet wordt waargenomen, dus het verwijst naar een contrafeitelijke variabele die niet wordt gerealiseerd in onze waargenomen steekproef.) Evenzo wordt de ATE gedefinieerd als: $ \ mathrm {E} [\ delta] $, dwz. wat is het verwachte causale effect van de behandeling voor alle individuen in de populatie. We kunnen dit weer zinvoller ontleden als: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Zoals je ziet, is de ATT en de meer algemene ATE verwijzen per definitie naar verschillende delen van de populatie van interesse. Wat nog belangrijker is, in het ideale scenario van een gerandomiseerde controlestudie ( RCT ) is ATE gelijk aan ATT omdat we aannemen dat:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ en
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
dwz. we zijn respectievelijk van mening dat:
- de basislijn van de behandelgroep gelijk is aan de basislijn van de controlegroep (lekentermen: mensen in de behandelgroep zouden net zo slecht doen als de controlegroep als ze niet werden behandeld) en
- het behandelingseffect op de behandelde groep is gelijk aan het behandelingseffect op de controlegroep (lekentermen: mensen in de controlegroep zouden het doen als goed als de behandelingsgroep als ze werden behandeld).
Dit zijn zeer sterke aannames die vaak worden geschonden in observationele studies en daarom de ATT en de ATE zullen naar verwachting niet gelijk zijn. (Merk op dat als alleen de basislijnen gelijk zijn, u nog steeds een ATT kunt krijgen via eenvoudige verschillen: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Vooral in de gevallen waarin de individuen zelf kiezen om wel of niet deel te nemen aan de behandelgroep (bijv. Een e-shop die een contante bonus biedt waar een klant een bonuscoupon voor een bedrag van $ X $, aangezien ze artikelen koopt met een waarde van ten minste $ Y $) kunnen zowel de basislijnen als de behandelingseffecten verschillen (bijv. terugkerende kopers zullen een dergelijke bonus eerder inwisselen, de drempel van $ Y $ onrealistisch hoge of hoogwaardige klanten kan onverschillig staan tegenover het bonusbedrag $ X $ – dit heeft ook betrekking op SUTVA ). In scenarios als deze is zelfs praten over ATE waarschijnlijk slecht gedefinieerd (het is bijvoorbeeld onrealistisch om te verwachten dat alle klanten van een e-shop ooit items zullen kopen ter waarde van $ Y $).
ATT ongelijk zijn aan ATE is niet onverwacht. Als ATT kleiner of groter is dan ATE is toepassingsspecifiek. De ongelijkheid van de twee suggereert dat het toewijzingsmechanisme van de behandeling mogelijk niet willekeurig was. In het algemeen, in een observationele studie, omdat de bovengenoemde aannames over het algemeen niet kloppen, verdelen we onze steekproef dienovereenkomstig of controleren we op verschillen door middel van “regressie-achtige” technieken.
Voor een meer gedetailleerde maar gemakkelijk te volgen uiteenzetting van de kwestie raad ik aan om Morgan & Winship “s Vervalsingen en causale gevolgtrekkingen .
Opmerkingen
- Hartelijk dank voor dit ongelooflijk gedetailleerde en nuttige antwoord. I ' m geen statisticus en heb soms moeite met formules, maar dit is heel duidelijk. Will Morga & Winship ' s boek verteerbaar door een leek, of kun je een " dummy ' s gids " naar causale gevolgtrekkingen? Nogmaals bedankt
- Ik ben blij dat ik kon helpen. Ik heb mezelf voornamelijk geleerd op basis van papieren, dus ik heb een beperkt beeld van welke oorzakelijke gevolgtrekkingsboeken er zijn. Dat gezegd hebbende, ik hebben gevonden dat het boek van M & W ' s boek duidelijk en gemakkelijk te begrijpen is; ik denk dat een geneigde leek dat wel zal hebben kleine problemen om door te nemen. Het boek maakt deel uit van de " Analytische methoden voor sociaal onderzoek " -serie van Cambridge Univ. Druk op zodat het voornamelijk op sociologie gebaseerde voorbeelden gebruikt. @ DimitriyV.Masterov heeft misschien een meer onderbouwde suggestie.
- Bedankt, ik ' zal mezelf een exemplaar bezorgen. " De ongelijkheid van de twee suggereert dat het toewijzingsmechanisme voor de behandeling mogelijk niet willekeurig was. " Ik neem aan in een hypothetische situatie waarin letterlijk elke basislijn confounder werd gemeten in een observationele studie, en er was een perfecte match voor elke PS, we zouden heel dicht bij die veronderstellingen komen. Zou de mate waarin ATT / ATE tegenstrijdig zijn daarom enige zinvolle informatie verschaffen over hoe slecht de PS in evenwicht was voor niet-gemeten confounders?
- In een hypothetische situatie, ja. Ik denk dat het zinvol zou zijn in de context van een simulatiestudie. Dat gezegd hebbende, het daadwerkelijk gebruiken ervan om " slechtheid / goedheid " van het door PS bereikte evenwicht te kwantificeren, is waarschijnlijk een methodische oefening op zich. (Veel leesplezier!)
- @bobmcpop Ik ' ben statisticus, en ik heb nooit begrepen waarom iemand de ATT zou willen meten in plaats van de ATE. Het ' is belangrijk om een controlegroep te hebben om rekening te houden met regressie naar de gemiddelde effecten & andere factoren – jij ' ontbreekt dit wanneer je de ATT gebruikt.
Antwoord
ATE is het gemiddelde behandelingseffect, en ATT is het gemiddelde behandelingseffect op de behandelde.
De ATT is het effect van de daadwerkelijk toegepaste behandeling. Medische studies gebruiken de ATT meestal als de aangewezen hoeveelheid van belang, omdat ze vaak alleen geven om het causale effect van medicijnen voor patiënten die de medicijnen krijgen of zouden krijgen.
Voor een ander voorbeeld vertelt ATT ons hoeveel de typische soldaat gewonnen of verloren als gevolg van militaire dienst, terwijl ATE ons vertelt hoeveel de typische aanvrager voor het leger gewonnen of verloren heeft.
Opmerkingen
- Je ' verwart de ATT met de ITT, intent-to-treat-effect.
- Ik verwar ' niet. Ik verwijs naar dit artikel: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Overeenkomen als niet-parametrische voorbewerking voor het verminderen van modelafhankelijkheid bij parametrische causale inferentie. Political analysis, 15 (3), 199-236.
- Je ' hebt gelijk, ik heb het verkeerd begrepen.
- Dit is een van de duidelijkste uitleg die ik heb gezien van ATE versus ATT