平均治療効果が治療に対する平均治療効果と異なるのはなぜですか?

RCTでは、ランダム化は測定されていない交絡因子のバランスを取り、ATEとATTは同じであると言われています。観察研究では、これは不可能であり、傾向スコアは、ATTやATEを推定するためにさまざまな方法で使用されます。私が実行した分析と私が見た例(例:この役立つテキスト)は異なるATTとATEを示しています(わずかではありますが)。

なぜそれらが異なるのか、さらに重要なことに、違いが何を意味するのか(たとえば、ATE> ATTまたはATT> ATEの場合)を理解するのを手伝ってください。何か?

回答

平均治療効果 ATE )また、治療に対する平均治療効果 ATT )は、さまざまな個人グループで一般的に定義されています。さらに、 ATE ATT は、同じ方法で治療$ D $の影響を受けない結果($ Y $)を測定する可能性があるため、多くの場合異なります。

最初、いくつかの追加表記:

  • $ Y ^ 0 $:制御状態の結果$ Y $の母集団レベルの確率変数。
  • $ Y ^ 1 $:母集団-治療状態での結果$ Y $のレベル確率変数。
  • $ \ delta $:治療の個人レベルの因果効果。
  • $ \ pi $:取る人口の割合

上記の場合、 ATT は次のように定義されます。$ \ mathrm {E} [\ delta | D = 1] $ ie。治療群の個人に対する治療の予想される因果効果は何ですか。これは、次のように、より意味のある形で分解できます。\ begin {align} \ mathrm {E} [\ delta | D = 1] = & \ mathrm {E} [Y ^ 1-Y ^ 0 | D = 1] \\ & \ mathrm {E} [Y ^ 1 | D = 1]-\ mathrm {E} [Y ^ 0 | D = 1] \ end {align}

($ \ mathrm {E} [Y ^ 0 | D = 1] $は観測されていないため、観測されたサンプルでは実現されていない反事実変数を参照していることに注意してください。)同様に、 ATE は次のように定義されます:$ \ mathrm {E} [\ delta] $、つまり。集団内のすべての個人にわたる治療の予想される因果効果は何ですか。ここでも、これをより意味のある形で分解できます。\ begin {align} \ mathrm {E} [\ delta] = & \ {\ pi \ mathrm {E} [Y ^ 1 | D = 1] +(1- \ pi)\ mathrm {E} [Y ^ 1 | D = 0] \} \\-& \ {\ pi \ mathrm {E } [Y ^ 0 | D = 1] +(1- \ pi)\ mathrm {E} [Y ^ 0 | D = 0] \} \ end {align}

ご覧のとおり ATT およびより一般的な ATE は、定義上、関心のある母集団のさまざまな部分を指します。さらに重要なことに、ランダム化比較試験( RCT )の理想的なシナリオでは、次のことを前提としているため、 ATE ATT と等しくなります。

  • $ \ mathrm {E} [Y ^ 0 | D = 1] = \ mathrm {E} [Y ^ 0 | D = 0] $および
  • $ \ mathrm {E} [ Y ^ 1 | D = 1] = \ mathrm {E} [Y ^ 1 | D = 0] $、

ie。

  • 治療群のベースラインは対照群のベースラインと等しい(素人用語:治療群の人々は悪い対照群(治療されていない場合)および
  • 治療群に対する治療効果は、対照群に対する治療効果と等しい(素人用語:対照群の人々は良い em>治療群として、治療された場合)。

これらは非常に強力な仮定であり、観察研究では一般的に違反されているため、 ATT および > ATE は等しいとは期待されていません。 (ベースラインのみが等しい場合でも、単純な違いによって ATT を取得できることに注意してください:$ \ mathrm {E} [Y ^ 1 | D = 1]-\ mathrm {E} [Y ^ 0 | D = 0] $。)

特に、個人が治療グループに参加するかどうかを自己選択する場合(たとえば、顧客が利用できる現金ボーナスを提供するeショップ)彼女が少なくとも$ Y $の金額に相当するアイテムを購入した場合、$ X $のボーナスクーポンベースラインと治療効果は異なる可能性があります(たとえば、リピーターはそのようなボーナスを利用する可能性が高く、価値の低い顧客は見つける可能性がありますしきい値$ Y $が非現実的に高い、または価値の高い顧客は、ボーナス額$ X $に無関心である可能性があります。これは、 SUTVA にも関連しています。このようなシナリオでは、 ATE について話すことさえ、おそらく明確に定義されていません(たとえば、eショップのすべての顧客が$ Y $相当の商品を購入することを期待するのは非現実的です)。

ATT ATE と等しくないことは予想外ではありません。 ATT ATE よりも小さいか大きい場合は、アプリケーション固有です。 2つの不平等は、治療割り当てメカニズムが潜在的にランダムではなかったことを示唆しています。一般に、観察研究では、上記の仮定が一般的に当てはまらないため、それに応じてサンプルを分割するか、「回帰のような」手法で差異を制御します。

問題のより詳細でわかりやすい説明については、モーガン& Winshipの反事実と因果推論

コメント

  • この非常に詳細で役立つ回答をありがとうございます。I' mは統計学者ではなく、数式に苦労することもありますが、これは非常に明確です。Morga&ウィンシップ'の本は素人が消化できるようにするか、"ダミー'ガイド"因果推論に感謝しますか?ありがとうございます
  • 私は助けてくれてうれしいです。私は主に論文から自分自身を教育したので、そこにある因果推論の本については限られた見方しかありません。 M & W 'の本は明確で理解しやすいものであることがわかりました。また、傾倒した素人は従うべき小さな問題。この本は、ケンブリッジ大学の" 社会調査の分析方法 "シリーズの一部です。主に社会学に基づいた例を使用するように押してください。 @ DimitriyV.Masterovにはもっと知識のある提案があるかもしれません。
  • ありがとう、'自分でコピーを入手します。 " 2つの不等式は、治療の割り当てメカニズムが潜在的にランダムではなかったことを示唆しています。"文字通りすべてのベースラインがある仮定の状況で想定します交絡因子は観察研究で測定され、各PSに完全に一致するため、これらの仮定に非常に近くなります。したがって、ATT / ATEが不一致である程度は、PSが測定されていない交絡因子に対してどの程度バランスが悪いかについての意味のある情報を提供しますか?
  • 仮想の状況では、そうです。シミュレーション研究の文脈では意味があると思います。とはいえ、PSによって達成されたバランスの" poorness / goodness "を定量化するために実際に使用することは、おそらくそれ自体が系統だった演習です。 (お読みください!)
  • @bobmcpop I 'は統計学者ですが、なぜ誰かがATEではなくATTを測定したいのか理解できませんでした。 '平均効果への回帰を説明するコントロールグループを持つことが重要です&他の要因-あなた' ATTを使用すると、これが欠落します。

回答

ATEは平均です治療効果、およびATTは治療されたものに対する平均治療効果です。

ATTは、実際に適用された治療の効果です。医学研究では通常、ATTを指定された関心のある量として使用します。これは、多くの場合、薬を受け取った、または受け取る予定の患者に対する薬の因果関係のみを気にするためです。

別の例として、ATTは典型的な兵士は兵役の結果として獲得または喪失しましたが、ATEは軍隊への典型的な申請者がどれだけ獲得または喪失したかを教えてくれます。

コメント

  • あなたは' ATTとITT、治療意図の効果を混同しています。
  • '混乱しません。この論文を参照します:Ho、D。E.、Imai、K.、King、G。、& Stuart、E。A.(2007)パラメトリック因果推論におけるモデル依存性を低減するためのノンパラメトリック前処理としてのマッチング。政治分析、15(3)、199-236。
  • あなたは'正解です、私は誤解しました。
  • これはATEとATTについて私が見た中で最も明確な説明

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です