Proč se průměrný léčebný účinek liší od průměrného léčebného účinku na léčené?

V RCT vyvažuje randomizace neměřené zmatky a, jak jsem řekl, ATE a ATT by byly stejné. V observačních studiích to není možné a Propensity Skóre se používá různými způsoby k odhadu ATT a / nebo ATE. Analýzy, které jsem provedl, a příklady, které jsem viděl (např. Tento užitečný text ) ukazuje různé ATT a ATE (i když mírně).

Prosím, pomozte mi někdo pochopit, proč se liší, a co je důležitější, co znamenají rozdíly (např. pokud ATE> ATT nebo ATT> ATE), pokud něco?

Odpověď

Průměrný efekt léčby ( ATE ) a průměrný účinek léčby na léčené ( ATT ) jsou běžně definovány napříč různými skupinami jednotlivců. Kromě toho ATE a ATT se často liší, protože mohou měřit výsledky ($ Y $), které nejsou ovlivněny ošetřením $ D $ stejným způsobem.

Nejprve , nějaká další notace:

  • $ Y ^ 0 $: náhodná proměnná na úrovni populace pro výsledek $ Y $ v kontrolním stavu.
  • $ Y ^ 1 $: populace- náhodná proměnná úrovně pro výsledek $ Y $ ve stavu léčby.
  • $ \ delta $: kauzální účinek léčby na jednotlivé úrovni.
  • $ \ pi $: podíl populace, která zabírá léčba.

Vzhledem k výše uvedenému je ATT definováno jako: $ \ mathrm {E} [\ delta | D = 1] $ tj. jaký je očekávaný příčinný účinek léčby na jednotlivce v léčené skupině. Toto lze smysluplněji rozložit jako: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}

(Všimněte si, že $ \ mathrm {E} [Y ^ 0 | D = 1] $ není pozorováno, takže odkazuje na srovnávací proměnnou, která není v našem pozorovaném vzorku realizována.) Podobně je ATE definováno jako: $ \ mathrm {E} [\ delta] $, tj. jaký je očekávaný kauzální účinek léčby na všechny jedince v populaci. Znovu to můžeme smysluplněji rozložit jako: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}

Jak vidíte ATT a obecnější ATE odkazují podle definice na různé části zájmové populace. Ještě důležitější je, že v ideálním scénáři randomizované kontrolní studie ( RCT ) ATE se rovná ATT , protože předpokládáme, že:

  • $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ a
  • $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,

tj. věříme respektive, že:

  • základní linie léčené skupiny se rovná základní linii kontrolní skupiny (laicky řečeno: lidé v léčené skupině by udělali to, co špatně jako kontrolní skupina, pokud nebyli léčeni) a
  • léčebný účinek na léčenou skupinu se rovná léčebnému účinku na kontrolní skupinu (laicky řečeno: lidé v kontrolní skupině by byli jako dobří jako léčená skupina, pokud byli léčeni).

Jedná se o velmi silné předpoklady, které jsou v pozorovacích studiích běžně porušovány, a proto ATT a ATE se neočekávají stejné. (Všimněte si, že pokud jsou stejné pouze základní linie, stále můžete získat ATT prostřednictvím jednoduchých rozdílů: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)

Zejména v případech, kdy si jednotlivci sami zvolí, zda vstoupí do léčebné skupiny, či nikoli (např. E-shop poskytující hotovostní bonus, kde může zákazník uplatnit bonusový kupón na částku $ X $ vzhledem k tomu, že nakupuje zboží v hodnotě alespoň $ Y $), základní linie i účinky léčby se mohou lišit (např. opakující se kupující s větší pravděpodobností takový bonus uplatní, zákazníci s nízkou hodnotou mohou najít prahová hodnota $ Y $ nerealisticky vysoce nebo vysoce hodnotní zákazníci mohou být lhostejní k bonusové částce $ X $ – týká se to také SUTVA ). V takových scénářích je dokonce i mluvení o ATE pravděpodobně špatně definované (např. Je nereálné očekávat, že všichni zákazníci e-shopu budou někdy nakupovat zboží v hodnotě $ Y $).

ATT nerovná jako ATE není neočekávané. Pokud je ATT menší nebo větší než ATE je specifické pro konkrétní aplikaci. Nerovnost těchto dvou naznačuje, že mechanismus přiřazení léčby nebyl potenciálně náhodný. Obecně platí, že v observační studii, protože výše uvedené předpoklady obecně neplatí, buď rozdělíme náš vzorek podle toho, nebo kontrolujeme rozdíl pomocí „regresních“ technik.

Pro podrobnější, ale snadno sledovatelnou expozici této záležitosti doporučuji nahlédnout do Morgan & Winship „s Counterfactuals and Causal Inference .

Komentáře

  • Děkuji mnohokrát za tuto neuvěřitelně podrobnou a užitečnou odpověď. I ' nejsem statistik a občas bojuji s formulemi, ale je to velmi jasné. Will Morga & Winship ' kniha může být laikem stravitelná, nebo můžete navrhnout " figurínu ' s příručku " k kauzální inference? Ještě jednou díky
  • jsem rád, že jsem mohl pomoci. Vzdělával jsem se většinou z papírů, takže mám omezený pohled na to, jaké kauzální inferenční knihy jsou venku. shledali knihu M & W ' srozumitelnou a snadno srozumitelnou; myslím, že nakloněný laik bude mít malé problémy, které je třeba splnit. Kniha je součástí série " Analytical Methods for Social Research " od společnosti Cambridge Univ. Tisk, takže používá převážně příklady založené na sociologii. @ DimitriyV.Masterov může mít vzdělanější návrh.
  • Díky, <

si dám kopii. " Nerovnost těchto dvou naznačuje, že mechanismus přiřazení léčby nebyl potenciálně náhodný. " Předpokládám, že v hypotetické situaci, kdy doslova každá výchozí hodnota zmatek byl měřen v observační studii a pro každý PS existovala dokonalá shoda, dostali bychom se velmi blízko k těmto předpokladům. Poskytla by tedy míra, do jaké jsou ATT / ATE nesourodé, jakékoli smysluplné informace o tom, jak špatně se PS vyvážila pro neměřené zmatky?

  • V hypotetické situaci ano. Myslím, že by to mělo smysl v kontextu simulační studie. To znamená, že jeho skutečné použití ke kvantifikaci " chudoby / dobroty " rovnováhy dosažené PS je pravděpodobně metodické cvičení samo o sobě. (Šťastné čtení!)
  • @bobmcpop Jsem ' statistik a nikdy jsem nepochopil, proč by někdo chtěl měřit ATT místo ATE. ' Je důležité mít kontrolní skupinu, která zohlední regresi k průměrným účinkům & dalších faktorů – vy ' toto chybí, když používáte ATT.
  • odpověď

    ATE je průměr účinek léčby a ATT je průměrný účinek léčby na léčeného.

    ATT je účinek skutečně použité léčby. Lékařské studie obvykle používají ATT jako určené množství zájmu, protože se často zajímají pouze o kauzální účinek léků na pacienty, kteří léky dostávají nebo by je dostávali.

    ATT nám například říká, kolik typický voják získaný nebo ztracený v důsledku vojenské služby, zatímco ATE nám říká, kolik typický uchazeč o armádu získal nebo ztratil.

    Komentáře

    • ' zaměňujete ATT s účinkem ITT, záměrně léčit.
    • Nezaměňuji '. Odkazuji na tento příspěvek: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Porovnávání jako neparametrické předzpracování ke snížení závislosti modelu v parametrické kauzální inference. Political analysis, 15 (3), 199-236.
    • Máte ' pravdu, nepochopil jsem.
    • Toto je jeden z nejjasnější vysvětlení, které jsem viděl u ATE vs. ATT

    Napsat komentář

    Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *