Negli RCT, la randomizzazione bilancia i fattori di confondimento non misurati e, mi è stato detto, ATE e ATT sarebbero gli stessi. Negli studi osservazionali, questo non è possibile e Propensione I punteggi vengono utilizzati in vari modi per stimare ATT e / o ATE. Le analisi che ho eseguito e gli esempi che ho visto (ad es. Questo utile testo ) mostra ATT e ATE diversi (anche se leggermente).
Qualcuno può aiutarmi a capire perché sono diversi e, cosa più importante, cosa significano le differenze (ad es. se ATE> ATT o ATT> ATE), se qualcosa?
Risposta
L Effetto medio del trattamento ( ATE ) e l Effetto medio del trattamento sui soggetti trattati ( ATT ) sono comunemente definiti nei diversi gruppi di individui. Inoltre, ATE e ATT sono spesso diversi perché potrebbero misurare i risultati ($ Y $) che non sono influenzati dal trattamento $ D $ nello stesso modo.
Primo , qualche notazione aggiuntiva:
- $ Y ^ 0 $: variabile casuale a livello di popolazione per il risultato $ Y $ nello stato di controllo.
- $ Y ^ 1 $: popolazione- variabile casuale di livello per il risultato $ Y $ nello stato di trattamento.
- $ \ delta $: effetto causale a livello individuale del trattamento.
- $ \ pi $: proporzione di popolazione che prende trattamento.
Dato quanto sopra, ATT è definito come: $ \ mathrm {E} [\ delta | D = 1] $ ie. qual è leffetto causale atteso del trattamento per gli individui nel gruppo di trattamento. Questo può essere scomposto in modo più significativo come: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Notare che $ \ mathrm {E} [Y ^ 0 | D = 1] $ non è osservato, quindi si riferisce a una variabile controfattuale che non è realizzata nel nostro campione osservato.) Allo stesso modo ATE è definito come: $ \ mathrm {E} [\ delta] $, ie. qual è leffetto causale atteso del trattamento su tutti gli individui della popolazione. Ancora una volta possiamo scomporlo in modo più significativo come: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Come vedi il ATT e il più generale ATE si riferiscono per definizione a porzioni differenti della popolazione di interesse. Ancora più importante, nello scenario ideale di uno studio di controllo randomizzato ( RCT ) ATE è uguale a ATT perché assumiamo che:
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ e
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
es. abbiamo ritenuto rispettivamente che:
- la linea di base del gruppo di trattamento è uguale alla linea di base del gruppo di controllo (termini laici: le persone nel gruppo di trattamento sarebbero cattive come il gruppo di controllo se non sono stati trattati) e
- leffetto del trattamento sul gruppo trattato è uguale alleffetto del trattamento sul gruppo di controllo (termini laici: le persone nel gruppo di controllo farebbero come buono come gruppo di trattamento se sono stati trattati).
Questi sono presupposti molto forti che vengono comunemente violati negli studi osservazionali e quindi ATT e ATE non dovrebbero essere uguali. (Nota che se solo le linee di base sono uguali, puoi comunque ottenere un ATT attraverso semplici differenze: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)
Soprattutto nei casi in cui le persone si auto-selezionano per entrare o meno nel gruppo di trattamento (ad es. Un e-shop che fornisce bonus in denaro dove un cliente può riscattare un buono bonus per un importo di $ X $ dato che acquista articoli per un valore di almeno $ Y $) le linee di base e gli effetti del trattamento possono essere diversi (ad es. gli acquirenti abituali hanno maggiori probabilità di riscattare un tale bonus, i clienti di scarso valore potrebbero trovare la soglia $ Y $ clienti di valore elevato o irrealisticamente potrebbe essere indifferente allimporto del bonus $ X $ – questo si riferisce anche a SUTVA ). In scenari come questo anche parlare di ATE è probabilmente mal definito (ad esempio, non è realistico aspettarsi che tutti i clienti di un e-shop acquistino mai articoli per un valore di $ Y $).
ATT non è uguale a ATE non è inaspettato. Se ATT è minore o maggiore di ATE è specifico dellapplicazione. La disuguaglianza dei due suggerisce che il meccanismo di assegnazione del trattamento era potenzialmente non casuale. In generale, in uno studio osservazionale poiché le ipotesi sopra menzionate non sono generalmente valide, suddividiamo il nostro campione di conseguenza o controlliamo la differenza attraverso tecniche “simili alla regressione”.
Per unesposizione più dettagliata ma facile da seguire della questione, consiglio di esaminare Morgan & Winship “s Controfattuali e inferenza causale .
Commenti
- Grazie mille per questa risposta incredibilmente dettagliata e utile. I ' non sono un esperto di statistica e a volte ho difficoltà con le formule, ma questo è molto chiaro. Morga & Winship ' può essere digeribile da un profano o puoi suggerire una " fittizia ' guida " allinferenza causale? Grazie ancora
- Sono contento di aver potuto aiutare. Mi sono formato principalmente dai giornali, quindi ho una visione limitata di quali libri di inferenza causale esistono. Detto questo, io hanno trovato il libro di M & W ' chiaro e facile da comprendere; Penso che un laico incline avrà piccoli problemi da seguire. Il libro fa parte della serie " Analytical Methods for Social Research " della Cambridge Univ. Stampa in modo che utilizzi principalmente esempi basati sulla sociologia. @ DimitriyV.Masterov potrebbe avere un suggerimento più istruito.
- Grazie, ' me ne procurerò una copia. " La disuguaglianza dei due suggerisce che il meccanismo di assegnazione del trattamento era potenzialmente non casuale. " Presumo in una situazione ipotetica in cui letteralmente ogni linea di base confonditore è stato misurato in uno studio osservazionale e cera una corrispondenza perfetta per ogni PS, ci saremmo avvicinati molto a queste ipotesi. Pertanto, la misura in cui ATT / ATE sono discordanti fornirebbe informazioni significative su quanto male il PS sia bilanciato per i confondenti non misurati?
- In una situazione ipotetica , sì. Penso che sarebbe significativo nel contesto di uno studio di simulazione. Detto questo, il suo utilizzo effettivo per quantificare " povertà / bontà " dellequilibrio raggiunto da PS è probabilmente un esercizio metodico a sé stante. (Buona lettura!)
- @bobmcpop ' sono uno statistico e non ho mai capito perché qualcuno dovrebbe misurare lATT invece dellATE. È ' importante disporre di un gruppo di controllo per tenere conto della regressione agli effetti medi & altri fattori: ' manca questo valore quando utilizzi ATT.
Risposta
ATE è la media effetto del trattamento e ATT è leffetto medio del trattamento sul soggetto trattato.
LATT è leffetto del trattamento effettivamente applicato. Gli studi medici in genere utilizzano lATT come quantità di interesse designata perché spesso si preoccupano solo delleffetto causale dei farmaci per i pazienti che ricevono o vorrebbero ricevere i farmaci.
Per un altro esempio, ATT ci dice quanto il il tipico soldato guadagnato o perso come conseguenza del servizio militare, mentre ATE ci dice quanto il tipico candidato allesercito ha guadagnato o perso.
Commenti
- Tu ' stai confondendo lATT con leffetto ITT, intent-to-treat.
- Non ' confondo. Mi riferisco a questo articolo: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matching come preelaborazione non parametrica per ridurre la dipendenza dal modello nellinferenza causale parametrica. Analisi politica, 15 (3), 199-236.
- ' hai ragione, ho capito male.
- Questo è uno dei le spiegazioni più chiare che ho visto di ATE vs ATT