In RCTs gleicht die Randomisierung nicht gemessene Störfaktoren aus, und, wie mir gesagt wurde, wären ATE und ATT gleich. In Beobachtungsstudien ist dies nicht möglich und Propensity Scores werden auf verschiedene Arten verwendet, um ATT und / oder ATE zu schätzen. Die Analysen, die ich durchgeführt habe, und Beispiele, die ich gesehen habe (z. B. dieser hilfreiche Text ) zeigt unterschiedliche ATT und ATE (wenn auch geringfügig).
Kann mir bitte jemand helfen, zu verstehen, warum sie unterschiedlich sind und, was noch wichtiger ist, was die Unterschiede bedeuten (z. B. wenn ATE> ATT oder ATT> ATE), wenn irgendetwas?
Antwort
Der durchschnittliche Behandlungseffekt ( ATE ) und der durchschnittliche Behandlungseffekt auf behandelte ( ATT ) werden üblicherweise für die verschiedenen Gruppen von Personen definiert. Zusätzlich sind ATE und ATT sind oft unterschiedlich, weil sie möglicherweise Ergebnisse ($ Y $) messen, die nicht auf die gleiche Weise von der Behandlung $ D $ betroffen sind.
Zuerst , einige zusätzliche Notation:
- $ Y ^ 0 $: Zufallsvariable auf Bevölkerungsebene für das Ergebnis $ Y $ im Kontrollzustand.
- $ Y ^ 1 $: Bevölkerung- Zufallsvariable für das Ergebnis $ Y $ im Behandlungszustand.
- $ \ delta $: Kausale Wirkung der Behandlung auf individueller Ebene.
- $ \ pi $: Anteil der Bevölkerung, die nimmt Behandlung.
In Anbetracht des oben Gesagten ist ATT definiert als: $ \ mathrm {E} [\ delta | D = 1] $ dh. Was ist der erwartete kausale Effekt der Behandlung für Personen in der Behandlungsgruppe? Dies kann sinnvoller zerlegt werden als: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y. ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}
(Beachten Sie, dass $ \ mathrm {E} [Y ^ 0 | D = 1] $ nicht beobachtet wird, sodass es sich um eine kontrafaktische Variable handelt, die in unserer beobachteten Stichprobe nicht realisiert wird.) In ähnlicher Weise ist ATE definiert als: $ \ mathrm {E} [\ delta] $, dh. Was ist der erwartete kausale Effekt der Behandlung bei allen Personen in der Bevölkerung? Wieder können wir dies sinnvoller zerlegen als: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E. } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}
Wie Sie das
- $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ und
- $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,
dh. Wir glauben jeweils, dass:
- die Basislinie der Behandlungsgruppe der Basislinie der Kontrollgruppe entspricht (Laienbegriffe: Personen in der Behandlungsgruppe würden so schlecht wie sein die Kontrollgruppe, wenn sie nicht behandelt wurden) und
- der Behandlungseffekt auf die behandelte Gruppe entspricht dem Behandlungseffekt auf die Kontrollgruppe (Laienbegriffe: Personen in der Kontrollgruppe würden als gut tun) em> als Behandlungsgruppe, wenn sie behandelt wurden).
Dies sind sehr starke Annahmen, die in Beobachtungsstudien häufig verletzt werden, und daher die ATT und die ATE wird voraussichtlich nicht gleich sein. (Beachten Sie, dass Sie, wenn nur die Basislinien gleich sind, durch einfache Unterschiede immer noch eine ATT erhalten können: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y. ^ 0 | D = 0] $.)
Insbesondere in den Fällen, in denen sich die Personen selbst auswählen, um in die Behandlungsgruppe einzutreten, oder nicht (z. B. ein E-Shop, der einen Bargeldbonus bietet, bei dem ein Kunde a einlösen kann Bonus-Gutschein für einen Betrag von $ X $, vorausgesetzt, sie kauft Artikel im Wert von mindestens $ Y $ ein. Die Basiswerte sowie die Behandlungseffekte können unterschiedlich sein (z. B. können wiederkehrende Käufer einen solchen Bonus eher einlösen, wenn Kunden mit geringem Wert dies finden Der Schwellenwert $ Y $ für unrealistisch hohe oder hochwertige Kunden ist möglicherweise gleichgültig gegenüber dem Bonusbetrag $ X $ – dies bezieht sich auch auf SUTVA ). In solchen Szenarien ist es wahrscheinlich schlecht definiert, über ATE zu sprechen (z. B. ist es unrealistisch zu erwarten, dass alle Kunden eines E-Shops jemals Artikel im Wert von $ Y $ einkaufen werden). P. >
ATT , das nicht mit ATE übereinstimmt, ist nicht unerwartet. Wenn ATT kleiner oder größer als ATE ist, ist dies anwendungsspezifisch. Die Ungleichheit der beiden legt nahe, dass der Behandlungszuweisungsmechanismus möglicherweise nicht zufällig war. Im Allgemeinen teilen wir in einer Beobachtungsstudie, da die oben genannten Annahmen im Allgemeinen nicht zutreffen, entweder unsere Stichprobe entsprechend auf oder kontrollieren den Unterschied durch „regressionsähnliche“ Techniken.
Für eine detailliertere, aber leicht verständliche Darstellung der Angelegenheit empfehle ich, Morgan & Winship „s Kontrafakten und kausale Folgerung .
Kommentare
- Vielen Dank für diese unglaublich detaillierte und hilfreiche Antwort. I ' bin kein Statistiker und kämpfe manchmal mit Formeln, aber das ist sehr klar. Will Morga & Winship ' kann von einem Laien verdaut werden, oder können Sie einen " Dummy ' s Leitfaden " zur kausalen Folgerung? Nochmals vielen Dank.
- Ich bin froh, dass ich helfen konnte. Ich habe mich hauptsächlich aus Papieren erzogen, sodass ich nur einen begrenzten Überblick darüber habe, welche kausalen Folgerungsbücher es gibt Ich habe festgestellt, dass das Buch von M & W ' klar und leicht zu verstehen ist. Ich denke, ein geneigter Laie wird es haben kleine Probleme zu lösen. Das Buch ist Teil der Reihe " Analytische Methoden für die Sozialforschung " von Cambridge Univ. Drücken Sie, damit hauptsächlich soziologiebasierte Beispiele verwendet werden. @ DimitriyV.Masterov könnte einen fundierteren Vorschlag haben.
- Danke, ich ' werde mir eine Kopie besorgen. " Die Ungleichung der beiden legt nahe, dass der Behandlungszuweisungsmechanismus möglicherweise nicht zufällig war. " Ich gehe in einer hypothetischen Situation davon aus, dass buchstäblich jede Basislinie Der Confounder wurde in einer Beobachtungsstudie gemessen, und es gab eine perfekte Übereinstimmung für jede PS. Wir würden diesen Annahmen sehr nahe kommen. Würde das Ausmaß, in dem ATT / ATE nicht übereinstimmen, aussagekräftige Informationen darüber liefern, wie schlecht das PS für nicht gemessene Störfaktoren ausgeglichen ist?
- In einer hypothetischen Situation ja. Ich denke, es wäre im Kontext einer Simulationsstudie sinnvoll. Das heißt, die tatsächliche Verwendung zur Quantifizierung von " Armut / Güte " des von PS erreichten Gleichgewichts ist wahrscheinlich eine eigenständige methodische Übung. (Viel Spaß beim Lesen!)
- @bobmcpop Ich ' bin ein Statistiker, und ich habe nie verstanden, warum jemand die ATT anstelle der ATE messen möchte. ' ist wichtig, eine Kontrollgruppe zu haben, um die Regression auf die mittleren Auswirkungen zu berücksichtigen. & andere Faktoren – Sie ' fehlt dies, wenn Sie das ATT verwenden.
Antwort
ATE ist der Durchschnitt Behandlungseffekt, und ATT ist der durchschnittliche Behandlungseffekt auf die behandelte.
Die ATT ist die Wirkung der tatsächlich angewendeten Behandlung. Medizinische Studien verwenden in der Regel die ATT als festgelegte interessierende Menge, da sie sich häufig nur um die kausale Wirkung von Arzneimitteln für Patienten kümmern, die die Arzneimittel erhalten oder erhalten würden.
In einem anderen Beispiel gibt ATT an, wie viel die Ein typischer Soldat hat infolge des Militärdienstes gewonnen oder verloren, während ATE angibt, wie viel der typische Bewerber für das Militär gewonnen oder verloren hat.
Kommentare
- Sie ' verwechseln das ATT mit dem ITT-Intent-to-Treat-Effekt.
- Ich verwechsle nicht '. Ich beziehe mich auf dieses Papier: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Matching als nichtparametrische Vorverarbeitung zur Reduzierung der Modellabhängigkeit bei der parametrischen kausalen Inferenz. Politische Analyse, 15 (3), 199-236.
- Sie ' haben Recht, ich habe es falsch verstanden.
- Dies ist einer der klarste Erklärungen, die ich von ATE vs ATT
gesehen habe