En los ECA, la aleatorización equilibra los factores de confusión no medidos y, según me dijeron, ATE y ATT serían lo mismo. En los estudios observacionales, esto no es posible y Propensity Las puntuaciones se utilizan de diversas formas para estimar el ATT o el ATE. Los análisis que he realizado y los ejemplos que he visto (p. Ej., Este útil texto ) muestra diferentes ATT y ATE (aunque ligeramente).
Por favor, ¿alguien puede ayudarme a entender por qué son diferentes y, lo que es más importante, qué significan las diferencias (p. ej., si ATE> ATT o ATT> ATE), si ¿algo?
Responder
El Efecto Promedio del Tratamiento ( ATE ) y el Efecto Promedio del Tratamiento en los Tratados ( ATT ) se definen comúnmente en los diferentes grupos de individuos. Además, ATE y ATT suelen ser diferentes porque pueden medir los resultados ($ Y $) que no se ven afectados por el tratamiento $ D $ de la misma manera.
Primero , alguna notación adicional:
- $ Y ^ 0 $: variable aleatoria a nivel de población para el resultado $ Y $ en el estado de control.
- $ Y ^ 1 $: población- variable aleatoria de nivel para el resultado $ Y $ en el estado de tratamiento.
- $ \ delta $: efecto causal del tratamiento a nivel individual.
- $ \ pi $: proporción de la población que toma tratamiento.
Dado lo anterior, el ATT se define como: $ \ mathrm {E} [\ delta | D = 1] $ ie. ¿Cuál es el efecto causal esperado del tratamiento para los individuos del grupo de tratamiento? Esto se puede descomponer de manera más significativa como: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Observe que $ \ mathrm {E} [Y ^ 0 | D = 1] $ no se observa, por lo que se refiere a una variable contrafactual que no se realiza en nuestra muestra observada). De manera similar, el ATE se define como: $ \ mathrm {E} [\ delta] $, es decir. ¿Cuál es el efecto causal esperado del tratamiento en todos los individuos de la población? Nuevamente, podemos descomponer esto de manera más significativa como: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Como ve el ATT y el ATE más general se refieren, por definición, a diferentes porciones de la población de interés. Más importante aún, en el escenario ideal de un ensayo de control aleatorio ( RCT ) ATE es igual a ATT porque asumimos que:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ y
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
es decir. creemos, respectivamente, que:
- la línea de base del grupo de tratamiento es igual a la línea de base del grupo de control (términos sencillos: las personas en el grupo de tratamiento harían como mal como el grupo de control si no fueron tratados) y
- el efecto del tratamiento en el grupo tratado es igual al efecto del tratamiento en el grupo de control (términos simples: las personas en el grupo de control harían como bien como el grupo de tratamiento si fueron tratados).
Estos son supuestos muy fuertes que comúnmente se violan en los estudios observacionales y, por lo tanto, el ATT y el ATE no se espera que sean iguales. (Tenga en cuenta que si solo las líneas base son iguales, aún puede obtener un ATT mediante diferencias simples: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Especialmente en los casos en los que las personas se auto-seleccionan para ingresar al grupo de tratamiento o no (por ejemplo, una tienda electrónica que proporciona un bono en efectivo donde un cliente puede canjear un cupón de bonificación por una cantidad de $ X $ dado que compra artículos con un valor mínimo de $ Y $) las líneas de base y los efectos del tratamiento pueden ser diferentes (por ejemplo, los compradores habituales tienen más probabilidades de canjear dicha bonificación, los clientes de bajo valor pueden encontrar el umbral de $ Y $ los clientes de alto valor o poco realistas pueden ser indiferentes al monto de la bonificación $ X $; esto también se relaciona con SUTVA ). En escenarios como este, incluso hablar de ATE probablemente esté mal definido (por ejemplo, no es realista esperar que todos los clientes de una tienda electrónica alguna vez compren artículos por valor de $ Y $).
ATT no es igual a ATE no es inesperado. Si ATT es menor o mayor que ATE es una aplicación específica. La desigualdad de los dos sugiere que el mecanismo de asignación de tratamiento potencialmente no fue aleatorio. En general, en un estudio observacional debido a que los supuestos antes mencionados no se cumplen, dividimos nuestra muestra en consecuencia o controlamos la diferencia mediante técnicas «similares a la regresión».
Para una exposición más detallada pero fácil de seguir del asunto, recomiendo buscar en Morgan & Winship «s Contrafactuales e inferencia causal .
Comentarios
- Muchas gracias por esta respuesta increíblemente detallada y útil. I ' No soy un estadístico y a veces lucho con las fórmulas, pero esto es muy claro. Will Morga & Winship ' El libro de div sea digerible por un profano, o puede sugerir una " ficticia ' s guía " ¿a la inferencia causal? Gracias de nuevo
- Me alegro de haber podido ayudar. Me he educado principalmente a partir de artículos, por lo que tengo una visión limitada de los libros de inferencia causal que existen. Dicho esto, he encontrado que el libro de M & W ' es claro y fácil de comprender; creo que un lego inclinado tendrá pequeños problemas para seguir adelante. El libro es parte de la serie " Métodos analíticos para la investigación social " de la Universidad de Cambridge. Presione para que utilice principalmente ejemplos basados en sociología. @ DimitriyV.Masterov podría tener una sugerencia más educada.
- Gracias, ' me conseguiré una copia. " La desigualdad de los dos sugiere que el mecanismo de asignación de tratamiento no fue potencialmente aleatorio. " Supongo que en una situación hipotética donde literalmente cada línea de base El factor de confusión se midió en un estudio observacional, y hubo una coincidencia perfecta para cada PS, nos acercaríamos mucho a esos supuestos. Por lo tanto, ¿la medida en que ATT / ATE son discordantes proporcionaría alguna información significativa sobre qué tan mal equilibrado el PS para los factores de confusión no medidos?
- En una situación hipotética , sí. Creo que sería significativo en el contexto de un estudio de simulación. Dicho esto, su uso real para cuantificar " debilidad / bondad " del equilibrio logrado por PS es probablemente un ejercicio metódico por derecho propio. (¡Feliz lectura!)
- @bobmcpop Yo ' soy estadístico y nunca he entendido por qué alguien querría medir el ATT en lugar del ATE. Es ' importante tener un grupo de control para tener en cuenta la regresión a los efectos medios & otros factores: usted ' te falta esto cuando usas el ATT.
Respuesta
ATE es el promedio efecto del tratamiento, y ATT es el efecto medio del tratamiento en los tratados.
El ATT es el efecto del tratamiento realmente aplicado. Los estudios médicos suelen utilizar el ATT como la cantidad designada de interés porque a menudo solo se preocupan por el efecto causal de los medicamentos para los pacientes que los reciben o que los recibirían.
Por otro ejemplo, el ATT nos dice cuánto típico soldado ganado o perdido como consecuencia del servicio militar, mientras que ATE nos dice cuánto ganó o perdió el típico aspirante al ejército.
Comentarios
- Usted ' confunde el ATT con el ITT, efecto de intención de tratar.
- No ' no confundo. Me refiero a este artículo: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Emparejamiento como preprocesamiento no paramétrico para reducir la dependencia del modelo en la inferencia causal paramétrica. Análisis político, 15 (3), 199-236.
- Tienes ' tienes razón, lo entendí mal.
- Este es uno de los explicaciones más claras que he visto de ATE vs ATT