평균치료효과

Average treatment effect

평균 치료 효과(ATE)는 무작위 실험, 정책 개입의 평가, 의료 재판의 치료(또는 개입)를 비교하는 데 사용되는 척도다.AET는 치료에 할당된 단위와 대조군에 할당된 단위 사이의 평균(평균) 결과의 차이를 측정한다.무작위 시험(즉, 실험 연구)에서 평균 처리 효과는 처리 단위와 미처리 단위에 대한 평균 결과의 비교를 사용하여 표본으로부터 추정할 수 있다.그러나 AET는 일반적으로 연구 설계나 추정 절차와 관계없이 연구자가 알고자 하는 인과 변수(즉, 모집단의 추정치 또는 속성)로 이해된다.무작위 할당을 통한 관찰 연구와 실험 연구 설계 모두 다양한 방법으로 AET를 추정할 수 있다.null

일반적 정의

농업과 의학 분야의 초기 통계 분석에서 유래한 '치료'라는 용어는 이제 자연과학과 사회과학의 다른 분야, 특히 심리학, 정치학, 경제학 등 공공정책의 영향 평가 등에 더 일반적으로 적용되고 있다.치료나 결과의 성격은 AET의 추정에서 비교적 중요하지 않다. 즉, AET의 계산은 치료제를 다른 단위가 아닌 일부 단위에 적용하도록 요구하지만, 그 치료의 특성(예: 제약, 인센티브 지급, 정치적 광고)은 정의 및 추정과 무관하다.ATT에서.null

"치료 효과"라는 표현은 관심의 결과 변수(예: 환자의 건강)에 대해 주어진 치료나 개입(예: 약물의 투여)의 인과적 효과를 말한다.인과관계Neyman-Rubin "잠재적 결과 프레임워크"에서 치료 효과는 두 개의 "잠재적 결과"라는 관점에서 각 개별 단위에 대해 정의된다.각 단위는 단위가 치료제에 노출될 경우 나타나는 하나의 결과와 단위가 대조군에 노출될 경우 나타나는 다른 결과를 가지고 있다."치료 효과"는 이 두 가지 잠재적 결과 사이의 차이점이다.그러나 이러한 개인 수준의 치료 효과는 개별 단위가 치료나 통제만 받을 수 있을 뿐 둘 다 받을 수는 없기 때문에 관찰할 수 없다.치료에 대한 무작위 배정은 치료에 할당된 단위와 대조군에 할당된 단위가 동일함을 보장한다(실험의 많은 반복에 걸쳐).실제로 두 그룹의 단위는 공변량과 잠재적 결과의 분포가 동일하다.따라서 처리 단위 사이의 평균 결과는 대조군 단위 사이의 평균 결과에 대한 반사실적 역할을 한다.이 두 평균의 차이는 AET로 관측할 수 없는 개인 수준 치료 효과의 분포의 중심 경향을 추정한다.[1]표본이 모집단에서 랜덤하게 구성되는 경우, 표본 AAT(약칭 SATE)도 모집단 AATT(약칭 PATE)의 추정치가 된다.[2]null

실험은 예상대로 잠재적 결과(및 모든 공변량)가 치료 및 통제 그룹에 균등하게 분포한다고 보장하지만 관찰 연구에서는 그렇지 않다.관찰 연구에서 단위는 무작위로 치료와 통제에 할당되지 않으므로, 치료의 배정은 관찰되지 않거나 관찰할 수 없는 요인에 따라 달라질 수 있다.관측된 요인은 통계적으로 제어할 수 있지만(예: 회귀 또는 일치를 통해), AAT의 추정치는 어느 단위가 치료를 받았는지 대조군에 영향을 미치는 관측 불가능한 요인에 의해 혼동될 수 있다.null

형식 정의

AAT을 공식적으로 정의하기 위해 두 잠재적 결과를 정의한다. y ( i) (는) 처리되지 않은 경우 i i에 대한 결과 변수 값이고, 개별 에 대한 결과 변수 값이다.치료를 받는다면예를 들어 y ( i) 은(는) 연구 중인 약물을 투여하지 않은 경우 개인의 건강 상태이고, ( 은 약물을 투여한 경우 건강 상태를 의미한다.null

개별 에 대한 치료 효과는 ( )- 0 (i)= ( i) 에 의해 주어진다 일반적인 경우, 이러한 효과가 개인에 걸쳐 일정하게 나타날 것이라고 기대할 이유가 없다.평균 치료 효과는 다음과 같다.

여기서 합계는 모든 N {\ 개인에 대해 발생한다.null

If we could observe, for each individual, and among a large representative sample of the population, we could estimate the ATE simply by taking the average value of across the sample.그러나 개인은 치료할 수도 없고 치료할 수도 없기 때문에 우리는 각 개인에 1( ){\i)}과y0 ( 모두를 관찰할 수 없다.예를 들어, 약물 예제에서 우리는 약을 받은 개인의 경우 y ( ){\만 관찰할 수 있고, 받지 않은 사람의 경우 y 0 ( )만 관찰할 수 있다.이것은 치료 효과의 평가에서 과학자들이 직면하고 있는 주요 문제로서 많은 추정 기법을 촉발시켰다.null

추정

데이터와 그 기초적인 상황에 따라, 많은 방법을 사용하여 AET를 추정할 수 있다.가장 일반적인 것은 다음과 같다.

모든 단위가 실업자 개인이고, 어떤 단위는 정책 개입(처리 그룹)을 경험하는 반면, 다른 단위는 그렇지 않은(통제 그룹)을 경험하는 예를 들어보자.관심의 인과적 영향은 구직 모니터링 정책(치료)이 실업 수속의 기간에 미치는 영향: 평균적으로, 개입을 경험하면 실업이 얼마나 짧아질까?이 경우 AET는 치료 및 통제 집단의 실업 기간에 대한 기대치(평균)의 차이다.null

이 예에서 긍정적인 AET는 일자리 정책이 실업 기간을 증가시켰다는 것을 시사한다.부정적인 AET는 일자리 정책이 실업 기간을 줄였다는 것을 암시할 것이다.AET 추정치가 0이면 실업 기간 측면에서 치료를 제공하는 데 유리하거나 불이익이 없음을 알 수 있다.AET 추정치가 0과 구별될 수 있는지(긍정적이거나 부정적이거나) 판단하려면 통계적 추론이 필요하다.null

AET는 치료의 평균 효과에 대한 추정치이기 때문에, 양수 또는 음수 AET는 특정 개인이 치료로 인해 이익을 얻거나 해를 입는다는 것을 나타내지 않는다.따라서 평균적인 치료 효과는 치료 효과의 분포를 무시한다.평균 효과가 양성이더라도 인구의 일부는 치료로 인해 더 악화될 수 있다.null

이질적 치료 효과

어떤 연구자들은 치료 효과가 다른 개인들에게 다르게 영향을 미치는 경우(유전자적으로) "히터겐성"이라고 부른다.예를 들어, 위와 같은 구직 감시 정책의 처우는 남성과 여성, 또는 다른 주에 사는 사람들에게 다르게 영향을 주었다.AET는 안정적인 단위 처리 값 가정()으로 알려진 강한 가정을 요구하며, 이는 잠재적 결과 y ( 의 값이 다른 모든 개인의 치료 노출과 치료를 할당하는 데 사용되는 메커니즘에 영향을 받지 않도록 요구한다.Let be the treatment, the treatment effect for individual is given by . The SUTVA assumption allows us to declare .

이질적인 치료 효과를 찾는 한 가지 방법은 연구 데이터를 부분군(예: 남성과 여성 또는 주별)으로 나누고, 평균 치료 효과가 부분군별로 다른지 확인하는 것이다.평균 치료 효과가 다를 경우 SUTVA를 위반한다.부분군당 AAT는 "조건부 평균 치료 효과"(CATE), 즉 부분군 구성원 자격에 따라 AAT가 조건부 평균 치료 효과(Conditional Average Treatment effect)라고 불린다.SUTVA가 유지되지 않을 경우 CATE를 추정치로 사용할 수 있다.null

이 접근방식의 어려움은 각 부분군이 연구 전체보다 실질적으로 적은 데이터를 가질 수 있다는 것이다. 따라서 부분군 분석 없이 주효과를 검출할 수 있도록 연구를 추진한 경우 부분군에 대한 영향을 적절히 판단할 수 있는 충분한 데이터가 없을 수 있다.null

무작위 숲을 이용한 이질적 치료 효과를 검출하는 연구도 있다.[3][4]null

참조

  1. ^ Holland, Paul W. (1986). "Statistics and Causal Inference". J. Amer. Statist. Assoc. 81 (396): 945–960. doi:10.1080/01621459.1986.10478354. JSTOR 2289064.
  2. ^ Imai, Kosuke; King, Gary; Stuart, Elizabeth A. (2008). "Misunderstandings Between Experimentalists and Observationalists About Causal Inference". J. R. Stat. Soc. Ser. A. 171 (2): 481–502. doi:10.1111/j.1467-985X.2007.00527.x.
  3. ^ Wager, Stefan; Athey, Susan (2015). "Estimation and Inference of Heterogeneous Treatment Effects using Random Forests". arXiv:1510.04342 [stat.ME].
  4. ^ "Explicitly Optimizing on Causal Effects via the Causal Random Forest: A Practical Introduction and Tutorial".

추가 읽기

  • Wooldridge, Jeffrey M. (2013). "Policy Analysis with Pooled Cross Sections". Introductory Econometrics: A Modern Approach. Mason, OH: Thomson South-Western. pp. 438–443. ISBN 978-1-111-53104-1.