Em RCTs, a randomização equilibra fatores de confusão não medidos e, eu disse, ATE e ATT seriam o mesmo. Em estudos observacionais, isso não é possível e propensão As pontuações são usadas de várias maneiras para estimar ATT e / ou ATE. As análises que realizei e os exemplos que vi (por exemplo, este texto útil) mostra diferentes ATT e ATE (embora ligeiramente).
Alguém pode me ajudar a entender por que eles são diferentes e, mais importante, o que significam as diferenças (por exemplo, se ATE> ATT ou ATT> ATE), se alguma coisa?
Resposta
O Efeito Médio do Tratamento ( ATE ) e o Efeito médio do tratamento no tratado ( ATT ) são comumente definidos em diferentes grupos de indivíduos. Além disso, ATE e ATT são frequentemente diferentes porque podem medir os resultados ($ Y $) que não são afetados pelo tratamento $ D $ da mesma maneira.
Primeiro , alguma notação adicional:
- $ Y ^ 0 $: variável aleatória em nível de população para o resultado $ Y $ no estado de controle.
- $ Y ^ 1 $: população- variável aleatória de nível para o resultado $ Y $ no estado de tratamento.
- $ \ delta $: efeito causal do tratamento em nível individual.
- $ \ pi $: proporção da população que leva tratamento.
Dado o acima exposto, o ATT é definido como: $ \ mathrm {E} [\ delta | D = 1] $ ie. qual é o efeito causal esperado do tratamento para os indivíduos do grupo de tratamento. Isso pode ser decomposto de forma mais significativa como: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Observe que $ \ mathrm {E} [Y ^ 0 | D = 1] $ não foi observado, portanto, se refere a uma variável contrafactual que não foi realizada em nossa amostra observada.) Da mesma forma, o ATE é definido como: $ \ mathrm {E} [\ delta] $, ie. qual é o efeito causal esperado do tratamento em todos os indivíduos da população. Novamente, podemos decompor isso de forma mais significativa como: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Como você vê o ATT e o mais geral ATE referem-se, por definição, a diferentes partes da população de interesse. Mais importante ainda, no cenário ideal de um ensaio de controle randomizado ( RCT ) ATE é igual a ATT porque assumimos que:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ e
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
ie. acreditamos respectivamente que:
- a linha de base do grupo de tratamento é igual à linha de base do grupo de controle (termos leigos: as pessoas no grupo de tratamento fariam tão mal quanto o grupo de controle se não fossem tratados) e
- o efeito do tratamento no grupo tratado é igual ao efeito do tratamento no grupo de controle (termos leigos: as pessoas no grupo de controle fariam o mesmo bom como o grupo de tratamento se eles foram tratados).
Estas são suposições muito fortes que são comumente violadas em estudos observacionais e, portanto, o ATT e o ATE não devem ser iguais. (Observe que se apenas as linhas de base forem iguais, você ainda pode obter um ATT por meio de diferenças simples: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Especialmente nos casos em que os indivíduos se auto-selecionam para entrar no grupo de tratamento ou não (por exemplo, uma loja virtual com bônus em dinheiro onde um cliente pode resgatar cupom de bônus para o valor de $ X $ dado que ela compra itens no valor de pelo menos $ Y $) as linhas de base, bem como os efeitos do tratamento podem ser diferentes (por exemplo, compradores recorrentes têm maior probabilidade de resgatar tal bônus, clientes de baixo valor podem descobrir o limite $ Y $ irrealisticamente alto ou clientes de alto valor podem ser indiferentes ao valor do bônus $ X $ – isso também se relaciona a SUTVA ). Em cenários como este, até mesmo falar sobre ATE é provavelmente mal definido (por exemplo, não é realista esperar que todos os clientes de uma loja virtual venham a comprar itens no valor de $ Y $).
ATT ser diferente de ATE não é inesperado. Se ATT for menor ou maior que ATE é específico do aplicativo. A desigualdade dos dois sugere que o mecanismo de atribuição de tratamento não era potencialmente aleatório. Em geral, em um estudo observacional, porque as suposições acima mencionadas geralmente não são válidas, dividimos nossa amostra de acordo ou controlamos a diferença por meio de técnicas “semelhantes à regressão”.
Para uma exposição mais detalhada, mas fácil de seguir, do assunto, recomendo examinar Morgan & Winship “s Contrafactuais e inferência causal .
Comentários
- Muito obrigado por esta resposta incrivelmente detalhada e útil. I ' Não sou estatístico e às vezes tenho dificuldade com fórmulas, mas isso é muito claro. Will Morga & Winship ' pode ser digerido por um leigo ou você pode sugerir um " dummy ' guia do " à inferência causal? Obrigado novamente
- Fico feliz por ter ajudado. Aprendi principalmente com os papéis, então tenho uma visão limitada de quais livros de inferência causal existem. Dito isso, eu descobriram que o livro de M & W ' s é claro e fácil de compreender; acho que um leigo inclinado terá pequenos problemas para seguir adiante. O livro faz parte da série " Métodos analíticos para pesquisa social " da Cambridge Univ. Press, portanto, usa principalmente exemplos baseados na Sociologia. @ DimitriyV.Masterov pode ter uma sugestão mais educada.
- Obrigado, ' vou conseguir uma cópia para mim. " A desigualdade dos dois sugere que o mecanismo de atribuição de tratamento não era potencialmente aleatório. " Suponho que em uma situação hipotética onde literalmente todas as linhas de base confundidor foi medido em um estudo observacional, e havia uma correspondência perfeita para cada PS, chegaríamos muito perto dessas suposições. Portanto, a extensão em que ATT / ATE são discordantes forneceria qualquer informação significativa sobre o quão mal o PS balanceado para fatores de confusão não medidos? Acho que seria significativo no contexto de um estudo de simulação. Dito isso, usá-lo para quantificar " pobreza / bondade " de equilíbrio alcançado pelo PS é provavelmente um exercício metódico por direito próprio. (Boa leitura!)
- @bobmcpop Eu ' sou um estatístico e nunca entendi por que alguém iria querer medir o ATT em vez do ATE. É ' importante ter um grupo de controle para contabilizar a regressão aos efeitos médios & outros fatores – você ' está perdendo isso quando você usa o ATT.
Resposta
ATE é a média efeito do tratamento, e ATT é o efeito médio do tratamento no tratado.
O ATT é o efeito do tratamento realmente aplicado. Os estudos médicos geralmente usam o ATT como a quantidade designada de interesse, porque muitas vezes eles só se preocupam com o efeito causal dos medicamentos para os pacientes que recebem ou iriam receber os medicamentos.
Para outro exemplo, o ATT nos diz quanto o O soldado típico ganho ou perdido como consequência do serviço militar, enquanto o ATE nos diz o quanto o candidato típico do exército ganhou ou perdeu.
Comentários
- Você ' está confundindo o ATT com o ITT, efeito de intenção de tratar.
- Eu não ' não confundo. Refiro-me a este artigo: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matching como pré-processamento não paramétrico para reduzir a dependência do modelo em inferência causal paramétrica. Análise política, 15 (3), 199-236.
- Você ' está certo, eu não entendi.
- Este é um dos explicações mais claras que vi de ATE vs ATT