Dlaczego średni efekt leczenia różni się od średniego efektu leczenia u leczonego?

W badaniach RCT randomizacja równoważy niezmierzone czynniki zakłócające i, jak powiedziano mi, ATE i ATT byłyby takie same. W badaniach obserwacyjnych nie jest to możliwe, a skłonność Wyniki są wykorzystywane na różne sposoby do szacowania ATT i / lub ATE. Analizy, które przeprowadziłem i przykłady, które widziałem (np. Ten pomocny tekst ) pokazuje różne ATT i ATE (choć nieznacznie).

Czy ktoś może mi pomóc zrozumieć, dlaczego są różne i, co ważniejsze, co oznaczają różnice (np. jeśli ATE> ATT lub ATT> ATE), jeśli coś?

Odpowiedź

Średni efekt leczenia ( ATE ) a Średni wpływ leczenia na leczonych ( ATT ) są powszechnie definiowane dla różnych grup osób. Ponadto ATE i ATT są często różne, ponieważ mogą mierzyć wyniki ($ Y $), na które leczenie nie wpływa w ten sam sposób.

Po pierwsze , dodatkowa notacja:

  • $ Y ^ 0 $: zmienna losowa na poziomie populacji dla wyniku $ Y $ w stanie kontrolnym.
  • $ Y ^ 1 $: populacja- zmienna losowa poziomu dla wyniku $ Y $ w stanie leczenia.
  • $ \ delta $: indywidualny efekt przyczynowy leczenia.
  • $ \ pi $: odsetek populacji, która leczenie.

Biorąc pod uwagę powyższe, ATT jest zdefiniowane jako: $ \ mathrm {E} [\ delta | D = 1] $ ie. jaki jest spodziewany efekt przyczynowy leczenia dla osób w grupie leczonej. Można to rozłożyć na bardziej znaczący sposób: \ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1 – Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 1] \ end {align}

(Zauważ, że $ \ mathrm {E} [Y ^ 0 | D = 1] $ nie jest obserwowane, więc odnosi się do zmiennej kontrfaktycznej, która nie jest realizowana w naszej obserwowanej próbce.) Podobnie ATE jest definiowane jako: $ \ mathrm {E} [\ delta] $, tj. jaki jest spodziewany skutek przyczynowy leczenia u wszystkich osób w populacji. Ponownie możemy to rozłożyć na bardziej znaczący sposób: \ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 1 | D = 0] \} \\ – & \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] + (1- \ pi) \ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}

Jak widzisz ATT i bardziej ogólne ATE odnoszą się z definicji do różnych części interesującej nas populacji. Co ważniejsze, w idealnym scenariuszu randomizowanej próby kontrolnej ( RCT ) ATE równa się ATT , ponieważ zakładamy, że:

  • $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $ i
  • $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $,

ie. wierzymy odpowiednio, że:

  • linia bazowa grupy leczonej jest równa linii bazowej grupy kontrolnej (terminy laika: osoby w grupie leczonej postępowałyby tak źle jak grupa kontrolna, jeśli nie byli leczeni) i
  • wpływ leczenia na grupę leczoną jest równy efektowi leczenia na grupie kontrolnej (terminy laika: osoby z grupy kontrolnej postąpiłyby jako dobrze jako grupę leczoną, jeśli byli leczeni).

Są to bardzo mocne założenia, które są często naruszane w badaniach obserwacyjnych, a zatem ATT i ATE nie powinny być równe. (Zauważ, że jeśli tylko linie bazowe są równe, nadal możesz uzyskać ATT z prostych różnic: $ \ mathrm {E} [Y ^ 1 | D = 1] – \ mathrm {E} [Y ^ 0 | D = 0] $.)

Szczególnie w przypadkach, gdy osoby samodzielnie wybierają wejście do grupy terapeutycznej lub nie (np. E-sklep oferujący bonus gotówkowy, w którym klient może zrealizować kupon bonusowy na kwotę X $, biorąc pod uwagę, że kupuje przedmioty o wartości co najmniej Y $), poziomy bazowe, a także efekty leczenia mogą być różne (np. klienci ponownie kupujący są bardziej skłonni do zrealizowania takiego bonusu, klienci o niskiej wartości mogą znaleźć próg Y $ dla klientów o nierealistycznie wysokiej lub wysokiej wartości może być obojętny na kwotę premii X $ – dotyczy to również SUTVA ). W takich scenariuszach nawet mówienie o ATE jest prawdopodobnie źle zdefiniowane (np. Nierealistyczne jest oczekiwanie, że wszyscy klienci e-sklepu będą kiedykolwiek robić zakupy o wartości Y $ Y $).

ATT nierówność ATE nie jest nieoczekiwana. Jeśli ATT jest mniejsze lub większe niż ATE , jest specyficzne dla aplikacji. Nierówność tych dwóch sugeruje, że mechanizm przypisania leczenia potencjalnie nie był przypadkowy. Ogólnie rzecz biorąc, w badaniu obserwacyjnym, ponieważ powyższe założenia nie są ogólnie aktualne, albo odpowiednio dzielimy naszą próbkę, albo kontrolujemy różnice za pomocą technik „podobnych do regresji”.

Aby uzyskać bardziej szczegółowe, ale łatwe do zrozumienia wyjaśnienie tej sprawy, zajrzyj do Morgana & Winship „s Przeciwfaktyczne i przyczynowe wnioskowanie .

Komentarze

  • Dziękuję bardzo za tę niezwykle szczegółową i pomocną odpowiedź. I ' nie jestem statystykiem i czasami mam problemy z formułami, ale jest to bardzo jasne. Czy Morga & Winship ' będzie strawna dla laika, czy też możesz zasugerować " fikcyjny ' przewodnik " do wnioskowania przyczynowego? Jeszcze raz dziękuję
  • Cieszę się, że mogłem pomóc. Uczyłem się głównie z dokumentów, więc mam ograniczony pogląd na to, jakie są dostępne książki do wnioskowania przyczynowego. uważam, że książka M & W ' jest jasna i łatwa do zrozumienia; myślę, że skłonny laik będzie miał małe problemy do rozwiązania. Książka jest częścią serii " Analytical Methods for Social Research " z Cambridge Univ. Press, więc używa głównie przykładów opartych na socjologii. @ DimitriyV.Masterov może mieć bardziej pouczającą sugestię.
  • Dzięki, ' zdobędę kopię. " Nierówność tych dwóch sugeruje, że mechanizm przypisywania leczenia był potencjalnie nieprzypadkowy. " Zakładam w hipotetycznej sytuacji, w której dosłownie każdy punkt odniesienia pomieszanie zostało zmierzone w badaniu obserwacyjnym i było idealne dopasowanie dla każdego PS, bardzo zbliżylibyśmy się do tych założeń. Czy zatem zakres, w jakim ATT / ATE są niezgodne, dostarczyłby jakichkolwiek znaczących informacji o tym, jak słabo zrównoważony jest PS dla niezmierzonych elementów zakłócających?
  • W hipotetycznej sytuacji, tak. Myślę, że miałoby to znaczenie w kontekście badania symulacyjnego. To powiedziawszy, faktyczne użycie go do ilościowego określenia " słabości / dobroci " równowagi osiągniętej przez PS jest prawdopodobnie samodzielnym ćwiczeniem metodycznym. (Miłej lektury!)
  • @bobmcpop Jestem ' statystykiem i nigdy nie rozumiałem, dlaczego ktoś miałby chcieć mierzyć ATT zamiast ATE. ' jest ważne, aby mieć grupę kontrolną, która uwzględni regresję do średnich efektów & inne czynniki – ' brakuje tego, gdy używasz ATT.

Odpowiedź

ATE to średnia efekt leczenia, a ATT to średni wpływ leczenia na leczonego.

ATT jest efektem faktycznie zastosowanego zabiegu. Badania medyczne zazwyczaj wykorzystują ATT jako wyznaczoną wielkość zainteresowania, ponieważ często dotyczą one tylko przyczynowego wpływu leków na pacjentów, którzy otrzymują lub mieliby otrzymać leki.

Dla innego przykładu, ATT mówi nam, ile typowy żołnierz zdobyty lub utracony w wyniku służby wojskowej, podczas gdy ATE mówi nam, ile zyskał lub stracił typowy kandydat do wojska.

Komentarze

  • ' ponownie mylisz ATT z ITT, efektem zamiaru leczenia.
  • Nie ' nie mylić. Odsyłam do tego artykułu: Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2007). Dopasowywanie jako nieparametryczne przetwarzanie wstępne w celu zmniejszenia zależności modelu w parametrycznym wnioskowaniu przyczynowym. Analiza polityczna, 15 (3), 199-236.
  • Masz ' masz rację, źle zrozumiałem.
  • To jest jeden z Najjaśniejsze wyjaśnienia, jakie widziałem w przypadku ATE vs ATT

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *