스필오버(실험)
Spillover (experiment)실험에서 스필오버는 실험에 의해 직접 치료되지 않는 대상에 대한 간접적인 영향이다.이러한 효과는 정책 분석에 유용하지만 실험의 통계적 분석을 복잡하게 한다.
스필오버 효과 분석에는 비간섭 가정 또는 SUTVA(안정적인 단위 처리 값 가정)의 완화가 포함된다.이러한 가정은 대상 i의 잠재적 결과의 공개가 대상 i의 치료 상태에 따라서만 달라지며, 다른 대상 j의 치료 상태에 영향을 받지 않는다는 것을 요구한다.연구원이 평균 치료 효과( 를 추정하려고 하는 일반적인 환경에서 비간섭 가정 위반은 평균 차이와 같은 AET에 대한 전통적인 추정기가 편향될 수 있음을 의미한다.단, 한 단위의 잠재적 결과의 공개가 다른 단위의 치료 과제에 좌우되는 경우가 많으며, 이러한 효과를 분석하는 것이 치료의 직접적인 효과를 분석하는 것만큼 중요할 수 있다.
이 문제에 대한 한 가지 해결책은 자신의 치료 상태와 관련 대상자의 치료 상태 측면에서 대상자의 잠재적 결과를 재정의함으로써 관심의 인과적 추정치를 재정립하는 것이다.그러면 연구자는 다양한 관심 추정치를 별도로 분석할 수 있다.여기서 한 가지 중요한 가정은 이 프로세스가 모든 유출 패턴을 포착하고, 모델링되지 않은 유출이 남아 있지 않다는 것이다(예: 유출은 2인 가구 내에서 발생하지만 그 이상은 아니다).
일단 잠재적 결과가 다시 정의되면, 나머지 통계 분석은 치료 일정의 주어진 치료에 노출될 확률을 모델링하고, 관심 추정치의 편향되지 않은(또는 점증적으로 편향되지 않은) 추정치를 산출하기 위해 역확률 가중치(IPW)를 사용하는 것을 포함한다.
스필오버 효과의 예
스필오버 효과는 다양한 방법으로 발생할 수 있다.일반적인 애플리케이션에는 소셜 네트워크 유출과 지리적 유출의 분석이 포함된다.예를 들면 다음과 같다.
- 통신:기술이나 제품에 대한 정보를 전달하는 개입은 초기 사용자 이상으로 확산될 경우 네트워크에 있는 다른 사용자의 테이크업 결정에 영향을 미칠 수 있다.[1]
- 경쟁=청년 구직자를 위한 취업알선 지원은 교육을 받지 못했지만 같은 일자리를 두고 경쟁하는 개인의 취업시장 전망에 영향을 미칠 수 있다.[2]
- 전염:지렁이 약을 받으면 다른 사람들이 병에 걸릴 가능성을 줄일 수 있다.[3]
- 억제:특정 지자체의 국정감사에 대한 정보는 인근 지자체로 확산될 수 있다.[4]
- 변위:주어진 거리에서 치안 활동을 강화하는 핫스팟 치안 개입은 범죄를 인근 미처리 거리로 전가시키는 결과를 초래할 수 있다.[5]
- 리소스 재할당:주어진 거리에서 경찰력을 증강하는 핫스팟 경찰 개입은 인근 거리의 경찰력을 감소시킬 수 있다.
- 사회적 비교: 개인을 임의로 새 동네로 이사할 수 있는 바우처를 받게 하는 프로그램은 그들의 주거환경에 대한 통제집단의 신념에 추가로 영향을 줄 수 있다.[6]
그러한 예에서 임의통제 재판에서의 치료는 개입을 받은 사람에게 직접적인 영향을 줄 수 있고 직접 치료받지 않은 사람에게도 파급 효과를 줄 수 있다.
통계적 이슈
실험에서 스필오버 효과를 추정하는 것은 연구자들이 반드시 고려해야 하는 세 가지 통계 문제를 도입한다.
비간섭 가정 완화
편견 없는 추론에 대한 한 가지 핵심 가정은 비간섭적 가정으로, 이것은 개인의 잠재적 결과는 다른 사람의 치료 할당에 의해서만 드러나지 않는다고 가정한다.[7]이러한 가정을 개인주의적 치료 반응[8] 또는 안정적 단위 치료 가치 가정이라고도 한다.비간섭성은 피험자가 치료, 결정 또는 경험에 대해 서로 의사소통할 수 있을 때 위반되며, 따라서 서로의 잠재적 결과에 영향을 미친다.비간섭 가정이 유지되지 않는 경우, 단위는 더 이상 두 가지 잠재적 결과(처리 및 통제)만 갖는 것이 아니라 다른 단위의 치료 과제에 의존하는 다양한 다른 잠재적 결과들을 갖게 되어 평균 치료 효과의 추정이 복잡해진다.[9]
스필오버 효과를 추정하려면 비간섭 가정을 완화해야 한다.한 단위의 성과는 치료 과제뿐만 아니라 이웃의 치료 과제에도 달려 있기 때문이다.연구자는 간섭 유형을 제한하는 일련의 잠재적 결과를 제시해야 한다.예를 들어 학부생에게 정치 정보를 보내 정치 참여도를 높이는 실험을 생각해 보자.만약 연구인구가 대학 기숙사에서 룸메이트와 함께 살고 있는 모든 학생들로 구성된다면, 학생 또는 그들의 파트너가 정보를 받았는지에 따라 네 가지의 잠재적 결과들을 상상할 수 있다. (각 2인실 외부로 유출되지 않았다고 가정한다.)
- Y는0,0 치료받지 않았을 때(0)의 잠재적 결과를 말하며, 룸메이트도 그렇지 않았을 때(0)의 결과를 가리킨다.
- Y는0,1 개인이 치료를 받지 않고(0) 룸메이트가 치료를 받았을 때 발생할 수 있는 잠재적 결과를 가리킨다.
- Y는1,0 (1)을 치료받았지만 룸메이트가 치료받지 않았을 때(0)의 잠재적 결과를 가리킨다.
- Y는1,1 (1)을 치료받고(1) 룸메이트를 치료받았을 때 개인의 잠재적인 결과를 가리킨다.
이제 개인의 결과는 그들이 치료를 받았는지와 그들의 룸메이트가 치료를 받았는지에 의해 영향을 받는다.개인이 직접 치료를 받지 않은 점을 감안하면 룸메이트의 치료 여부에 따라 자신의 결과가 어떻게 달라지는지 살펴봄으로써 한 가지 유형의 스필오버 효과를 추정할 수 있다.이는 Y-Y의0,10,0 차이에 의해 포착될 것이다. 마찬가지로, 우리는 개인 자신이 치료받을 때 룸메이트의 치료 상태에 따라 그들의 결과가 어떻게 변하는지 측정할 수 있다.이것은 Y-Y의1,11,0 차이를 가져가는 것에 해당한다.
연구자들은 일반적으로 까다로운 가정을 덜 요구하기 때문에 실험을 수용하지만, 유출은 "형태로 명시하는 것이 제한되지 않고 불가능한 범위"가 될 수 있다.[10] 연구자는 반드시 어떤 유형의 스필오버가 작동하는지 구체적인 가정을 해야 한다.특정 환경에서 유출이 어떻게 발생하는지에 따라 다양한 방법으로 비간섭 가정을 완화할 수 있다.스필오버 효과를 모형화하는 한 가지 방법은 위의 예와 같이 바로 이웃을 치료했는지 여부를 나타내는 이진 표시기이다.또한 k-레벨 효과라고도 알려진, 치료된 가까운 이웃의 수에 따라 달라지는 스필오버 효과를 추정할 수 있다.[11]
노출 매핑
인과적 추정치를 재정립한 후 다음 단계는 치료 할당 벡터(bector)를 주어진 분석에서 각 피험자의 스필오버 노출 확률을 특성화하는 것이다.아로노우와 사미이(2017년)[12]는 분석에서 각 단위의 노출 확률 행렬을 얻기 위한 방법을 제시한다.
First, define a diagonal matrix with a vector of treatment assignment probabilities
둘째, 장치가 스필오버에 노출되었는지 여부에 대한 표시기 I{\을(를) 정의하십시오.이것은 네트워크에 관한 정보가 지표 매트릭스로 변환될 수 있는 오른쪽의 인접 매트릭스를 사용하여 이루어진다.이 결과 표시기 행렬은 의 값을 포함하며 임의의 이진 = f i _{rig)의 실현 값은 해당 단위가 유출되었는지 여부를 나타낸다.
Third, obtain the sandwich product , an N x N matrix which contains two elements: the individual probability of exposure on the diagonal, and the joint exposure probabilities i j(k) {\k}\ 대각선 바깥쪽:
그런 다음 획득한 확률 {\}을(를) Horvitz-Thompson Estimator와 같은 추정기에서 역 확률 가중치(IPW, 이하 설명)에 사용할 수 있다.
한 가지 중요한 주의사항은 노출 확률이 0인 모든 단위(예: 다른 단위와 연결되지 않은 단위)를 제외한다는 것이다. 이 숫자는 IPW 회귀 분석의 분모로 끝나기 때문이다.
역 확률 가중치에 대한 필요성
스필오버 효과를 추정하기 위해서는 추가적인 주의가 필요하다. 치료는 직접 할당되지만 스필오버 상태는 간접적으로 할당되며 장치에 대한 스필오버 할당 확률은 상이할 수 있다.예를 들어, 10명의 친구를 가진 주체는 한 명의 친구만 사귀는 주체가 아닌, 간접적으로 치료에 노출될 가능성이 더 높다.스필오버 노출의 다양한 확률을 고려하지 않으면 평균 스필오버 효과의 추정치가 편향될 수 있다.
그림 1은 장치가 스필오버 조건에 할당될 확률을 변화시키는 예를 보여준다.그림 A는 녹색 단위가 치료를 받을 수 있는 25개 노드의 네트워크를 표시한다.스필오버는 처리된 장치와 적어도 하나의 가장자리를 공유하는 것으로 정의된다.예를 들어 노드 16이 처리되는 경우 노드 11, 17 및 21은 스필오버 유닛으로 분류된다.이 6개의 녹색 단위 중 3개를 무작위로 선택하여 시술한다고 가정해 보십시오 ( )= 의 다른 치료 할당 세트가 가능.이 경우 하위 그림 B는 각 노드의 스필오버 조건에 할당될 확률을 표시한다.노드 3은 처리된 세 개의 유닛과 가장자리를 공유하기 때문에 무작위화의 95%에서 스필오버하도록 할당된다.이 노드는 무작위화 5%의 제어 노드(즉, 처리된 3개 노드가 14, 16, 18일 때)에만 제어 노드가 된다.한편, 노드 15는 시간의 50%만 유출하도록 할당된다. 노드 14를 직접 처리하지 않으면 노드 15는 유출에 할당되지 않는다.
역 확률 가중치 사용
할당 확률을 달리하는 실험을 분석할 때는 특별한 예방 조치를 취해야 한다.할당 확률의 이러한 차이는 IPW(역-확률-가중치) 회귀 분석을 통해 중화될 수 있으며, 여기서 각 관측치는 Horvitz-Thompson 추정기를 사용하여 관찰된 처리 조건에 할당될 확률의 역에 의해 가중된다.[13]이 접근방식은 잠재적 결과가 할당 확률과 체계적으로 관련되었을 때 발생할 수 있는 편견을 다룬다.이 추정기의 단점은 일부 관측치에 높은 중량이 주어질 경우(즉, 유출될 확률이 낮은 단위는 우연히 유출 조건에 할당됨) 표본 변동성이 있을 수 있다는 것이다.
가설 검정에 랜덤화 추론 사용
일부 환경에서는 스필오버 효과의 변동성을 추정하면 추가적인 어려움이 발생한다.연구자가 학교나 가정과 같이 클러스터링 단위가 고정되어 있는 경우, 클러스터-로봇 표준 오류와 같은 전통적인 표준 오류 조정 도구를 사용할 수 있어 클러스터 내 오류 용어의 상관관계는 가능하지만 전체 오류는 가능하지 않다.[14]그러나 다른 설정에서는 클러스터링의 고정 단위가 없다.이러한 설정에서 가설 시험을 실시하기 위해서는 무작위 추론을 사용하는 것이 좋다.[15]이 기법은 스필오버가 고정된 클러스터링 단위를 준수하지 않지만 퍼지 클러스터링의 경우처럼 유사한 스필오버 조건에 할당되는 경향이 있는 경우에도 p-값과 신뢰 구간을 생성할 수 있다.
참고 항목
참조
- ^ "Diffusion of Technologies within Social Networks: Evidence from a Coffee Training Program in Rwanda". IGC. Retrieved 2018-12-11.
- ^ Zamora, Philippe; Rathelot, Roland; Gurgand, Marc; Duflo, Esther; Crépon, Bruno (2013-05-01). "Do Labor Market Policies have Displacement Effects? Evidence from a Clustered Randomized Experiment". The Quarterly Journal of Economics. 128 (2): 531–580. doi:10.1093/qje/qjt001. hdl:1721.1/82896. ISSN 0033-5533. S2CID 15381050.
- ^ "Worms: Identifying Impacts on Education and Health in the Presence of Treatment Externalities Edward Miguel, Professor of Economics, University of California, Berkeley". emiguel.econ.berkeley.edu. Retrieved 2018-12-11.
- ^ Avis, Eric; Ferraz, Claudio; Finan, Frederico (2018). "Do Government Audits Reduce Corruption? Estimating the Impacts of Exposing Corrupt Politicians" (PDF). Journal of Political Economy. 126 (5): 1912–1964. doi:10.1086/699209. hdl:10419/176135. S2CID 36161954.
- ^ Weisburd, David; Telep, Cody W. (2014-05-01). "Hot Spots Policing: What We Know and What We Need to Know". Journal of Contemporary Criminal Justice. 30 (2): 200–220. doi:10.1177/1043986214525083. ISSN 1043-9862. S2CID 145692978.
- ^ Sobel, Michael (2006). "What do randomized studies of housing mobility demonstrate?". Journal of the American Statistical Association. 101:476 (476): 1398–1407. doi:10.1198/016214506000000636. S2CID 739283.
- ^ "PsycNET". psycnet.apa.org. Retrieved 2018-12-11.
- ^ Manski, Charles F. (2013-02-01). "Identification of treatment response with social interactions" (PDF). The Econometrics Journal. 16 (1): S1–S23. doi:10.1111/j.1368-423X.2012.00368.x. hdl:10419/64721. ISSN 1368-4221. S2CID 1559596.
- ^ Rosenbaum, Paul R. (2007). "Interference Between Units in Randomized Experiments". Journal of the American Statistical Association. 102 (477): 191–200. CiteSeerX 10.1.1.571.7817. doi:10.1198/016214506000001112. S2CID 38153548.
- ^ Rosenbaum, Paul R. (2007). "Interference Between Units in Randomized Experiments". Journal of the American Statistical Association. 102 (477): 191–200. CiteSeerX 10.1.1.571.7817. doi:10.1198/016214506000001112. S2CID 38153548.
- ^ Kao, Edward; Toulis, Panos (2013-02-13). "Estimation of Causal Peer Influence Effects". International Conference on Machine Learning: 1489–1497.
- ^ Aronow, Peter M.; Samii, Cyrus (2017-12-01). "Estimating average causal effects under general interference, with application to a social network experiment". The Annals of Applied Statistics. 11 (4): 1912–1947. arXiv:1305.6156. doi:10.1214/16-aoas1005. ISSN 1932-6157. S2CID 26963450.
- ^ Hortvitz, D. G.; Thompson, D. J. (1952). "A generalization of sampling without replacement from a finite universe". Journal of the American Statistical Association. 47 (260): 663–685. doi:10.1080/01621459.1952.10483446. JSTOR 2280784. S2CID 120274071.
- ^ A. Colin Cameron; Douglas L. Miller. "A Practitioner's Guide to Cluster-Robust Inference" (PDF). Cameron.econ.ucdavis.edu. Retrieved 19 December 2018.
- ^ "10 Things to Know About Randomization Inference". Egap.org. Retrieved 2018-12-11.