차이의 차이

Difference in differences

,'라고 한 자연 experimen에 치료의 대'control 그룹은 'treatment 그룹'에 차등 효과 공부로 한 실험적 연구 설계 관찰 연구. 데이터를 사용하는 차이에서 차이(DID[1]또는 DD[2])는 통계적인 기술은 사회 과학의 계량 경제학 및 정량적 연구에서 사용했다.t.[3] 처리 그룹에 대한 결과 변수의 평균 변동을 대조군 그룹의 평균 변수와 비교하여 결과(즉, 반응 변수 또는 종속 변수)에 대한 처리 효과(설명 변수 또는 독립 변수)를 계산한다. 이 방법은 외부 요인과 선택 편향의 영향을 완화하기 위한 것이었지만, 치료군 선택 방법에 따라 이 방법은 여전히 특정 편향(예: 평균 회귀, 역인성누락된 변수 편향)을 받을 수 있다.

피험자에 대한 치료 효과의 시계열 추정치(시간에 따른 차이를 분석) 또는 치료 효과의 단면 추정치(치료와 대조군 그룹 간의 차이를 측정)와는 달리, 차이점은 패널 데이터를 사용하여 치료와 대조군 그룹 간의 차이를 측정한다.시간 경과에 따라 발생하는 결과 변수의 변화

일반적 정의

Illustration of Difference in Differences.png

차이의 차이는 치료 그룹과 대조군으로부터 두 개 이상의 다른 기간에 측정된 데이터, 특히 "치료" 전 최소 한 기간과 "치료" 후 최소 한 번의 기간을 필요로 한다. 그림의 예에서 처리 그룹의 결과는 선 P로 표시되고 대조군의 결과는 선 S로 표시된다. 두 그룹의 결과(의존적) 변수는 P1 S1 점으로 대표되는, 어느 한 그룹이라도 치료를 받기 전(즉, 독립 변수 또는 설명 변수) 1시에 측정한다. 그런 다음 치료 그룹은 치료를 받거나 경험하고 두 그룹 모두 2시에 다시 측정한다. 때문에 치료 집단과 통제 그룹이 같은 시점 시간 1시에 시작한 게 아니에요 모든 시간에 치료와 조종 장치들 사이에 차이는 2(P2와 S2사이에 그것은, 그 차이)치료는 효과로도. 따라서, 그 결과 변수에톤 사이의"정상"차이를 계산하게 놔두설명될 수 있he 두 그룹(두 그룹 모두 치료를 경험하지 않은 경우 여전히 존재할 수 있는 차이)은 점선 Q로 표시된다(P에서1 Q까지의 기울기가 S에서1 S까지의2 기울기와 동일하다는 유의). 치료 효과는 관측된 결과(P2)와 "정상" 결과(P와2 Q의 차이)의 차이다.

형식 정의

모델 고려

여기서 i 및 시간 s(i 는 i i 속한 그룹(, 처리 그룹)이고, ( 는 짧은 한이다.d () displaystyle (\에 설명된 이벤트가 참일 때 1과 같은 더미 변수의 경우, 그렇지 않으면 0이 된다. 그룹별 대비 시간 그림에서 s 에 대한 그래프의 수직 절편이며 t{\ 병렬 추세 가정에 따라 두 그룹이 공유하는 시간 추세(아래 가정 참조). }이가) 치료 효과이고, t{\ 잔존 용어다.

그룹 및 시간별로 종속 변수 및 더미 표시기의 평균을 고려하십시오.

s= , = ,2{\ 단순성을 D s {\는 랜덤이 아니며 그룹과 기간의 레이블 지정 방법을 인코딩할 뿐이라는 점에 유의하십시오 그러면

그렇다면 엄격한 이질성 가정은 다음과 같은 것을 암시한다.

Without loss of generality, assume that is the treatment group, and is the after period, then and , giving the DID estimator

에 표시된 치료의 치료 효과로 해석할 수 있다 아래에는 이 추정기를 일반적인 최소 제곱법에서 계수로 읽을 수 있는 방법이 나와 있다. 이 절에서 설명하는 모델은 너무 많이 매개변수화되어 있다. 예를 들어, 더미 변수에 대한 계수 중 하나를 0으로 설정할 수 있도록 to = 을(를) 설정할 수 있다

가정

병렬 추세 가정 그림

OLS 모델의 모든 가정은 DID에도 동일하게 적용된다. 또한 DID는 병렬적인 추세 가정을 요구한다. 병렬 추세 가정에서는 - 1}는 = = 2}에서 모두 동일하다고 말하고 있다 위의 공식 정의가 정확하게 현실을 나타낸다는 점에서 이 가정은 자동으로 유지된다. 그러나 : - - _2111가 더 현실적일 수 있다. 병렬 추세 가정 유지 가능성을 높이기 위해 차이점 접근방식은 종종 일치와 결합된다.[4] 여기에는 '매칭'이라고 알려진 '처리' 유닛과 모의실험된 반사실적 '제어' 유닛, 즉 치료를 받지 않은 특성적으로 동등한 유닛이 포함된다. 결과 변수를 시간적 차이(전처리 기간과 후처리 기간 사이의 관찰된 결과의 변화)로 정의하고 유사한 전처리 이력에 기초하여 큰 표본의 여러 단위를 일치시킴으로써, 결과 AT(즉, ATT: 치료제에 대한 평균 처리 효과)는 강력한 차이-차이 추정치를 제공한다. 치료 효과의 이는 두 가지 통계적 목적에 부합한다. 첫째, 전처리 공변량을 조건으로, 병렬 경향 가정이 유지될 가능성이 높다. 둘째, 이 접근법은 유효한 추론에 필요한 관련 무식한 가정에 대한 의존성을 감소시킨다.

오른쪽에서 설명한 것처럼 치료 효과는 치료법이 없었더라면 y의 관측값과 y의 값이 평행한 추세를 보였을 때의 차이다. DID의 아킬레스건은 치료와 동시에 치료 이외의 다른 것이 한 그룹에서 변화할 때 나타나는 것으로, 병행 경향 가정 위반을 암시한다.

DID 추정치의 정확성을 보장하기 위해, 두 그룹의 개인 구성은 시간이 지남에 따라 변하지 않는 것으로 가정한다. DID 모델을 사용할 때는 자기 상관[5]아센펠터 디핑과 같이 결과를 손상시킬 수 있는 다양한 문제를 고려하고 처리해야 한다.


실행

DID 방법은 아래 표에 따라 구현할 수 있으며, 여기서 오른쪽 하단 셀은 DID 추정기이다.

차이점
변화하다

회귀 분석을 실행하면 동일한 결과가 나온다. OLS 모델 고려

여기서 에 대한 더미 변수로서 t = 때 1 과 같으며 {\S}은 그룹 멤버쉽에 대한 더미 로서s = {\과 같다. 복합 변수 ) S= = S을(를) 나타내는 더미 변수다 여기서 엄격하게 보이지는 않지만, 이것은 모델 공식 정의의 적절한 파라메트리화이며, 나아가 모델과 관련된 섹션의 그룹 및 기간 평균이 모형에 관련된 것으로 밝혀졌다. 다음과 같은 모수 추정치

여기서 () {\)은 샘플에 대해 계산된 조건부 평균을 나타내며, 예를 들어 = {\}는 사후 기간에 대한 지표, = 제어 그룹의 지표다. ^ }}은(는) 제어 그룹의 영향보다는 반작용에 대한 추정치라는 점에 유의하십시오. 대조군 그룹은 종종 반작용제의 대용물로 사용된다(이 점에 대한 보다 깊은 이해를 위한 합성 대조군 방법 참조). 따라서 ^ {\{\}}1}은(는) 제어 그룹과 개입(치료)의 반작용에 의한 충격으로 해석할 수 있다. 마찬가지로 추세 가정으로 인해 T= 1 의 처리 그룹과 제어 그룹 간의 차이도 동일하다 위의 설명은 제어 그룹만의 (평균) 효과를 암시하는 것으로 해석해서는 안 된다., or only the difference of the treatment and control groups in the pre-period, for . As in Card and Krueger, below, a first (time) difference of the outcome variable eliminates the need for time-trend (i.e., ) to form an unbiased estimate of , implying that is not actually conditional on the treatment or control grou치료 차이 _{3}}β ^ 3{\displaystyle{\hat{\beta}의 불편 추정치}을 만들기 위해(즉,β ^ 2{\displaystyle{\hat{\beta}}_{2}})P.[6]항상, 치료와 조종 장치들 사이에서 차이점이다. 이 미묘한 차이는 사용자 믿는다 이해하는 것이 중요하다(w.는 제거할 것eak) 병렬 사전 측정의 위반이 존재하거나, 비공통 충격 또는 교란 사건의 존재를 감안한 적절한 반사실적 근사 가정 위반의 경우. 이 표기법과 이전 절의 관계를 보려면 각 그룹에 대해 각 기간당 하나의 관측치만 위와 같이 고려하십시오.

의 다른 값과 같은 경우 등

그러나 이것은 공식적 정의와 위 표에 제시된 치료 효과에 대한 표현이다.

카드 및 크루거(1994) 예제

가장 유명한 DID 연구 중 하나인 Card and Krueger뉴저지 최저 임금에 관한 기사를 생각해 보자.[7] 카드와 크루거는 뉴저지 주와 펜실베이니아 주, 1992년 2월, 뉴저지 주 최저임금이 1992년 4월 4.25달러에서 5.05달러로 오른 뒤 1992년 11월 패스트푸드 분야고용을 비교했다. 뉴저지 주의 고용 변화를 관찰하는 것은 치료 전후의 뉴저지 주의 날씨와 거시경제 조건과 같은 누락된 변수에 대해서만 통제하지 못할 것이다. 펜실베니아를 차이-차이 모델에 컨트롤로 포함시킴으로써, 뉴저지와 펜실베니아에 공통적인 변수에 의해 야기되는 편향은 이러한 변수들이 관측되지 않을 때에도 암묵적으로 제어된다. 뉴저지와 펜실베이니아주가 시간이 지날수록 비슷한 추세를 보인다고 가정할 때 펜실베이니아주의 고용 변화는 최저임금을 인상하지 않았다면 뉴저지가 경험했을 변화로 해석할 수 있고, 반대로도 그렇다. 일부 경제 이론이 시사하는 것과 달리 최저임금 인상이 뉴저지의 고용 감소를 유도하지 않았다는 증거였다. 아래 표는 FTE(또는 상근 동등물)로 측정된 고용에 대한 치료 효과에 대한 카드 & 크루거의 추정치를 보여준다. 카드와 크루거는 뉴저지 주에서 최저임금 0.80달러 인상이 고용 2.75 FTE 상승으로 이어진 것으로 추산하고 있다.

뉴저지 주 펜실베이니아 차이점
2월 20.44 23.33 −2.89
11월 21.03 21.17 −0.14
변화하다 0.59 −2.16 2.75

참고 항목

참조

  1. ^ Abadie, A. (2005). "Semiparametric difference-in-differences estimators". Review of Economic Studies. 72 (1): 1–19. CiteSeerX 10.1.1.470.1475. doi:10.1111/0034-6527.00321.
  2. ^ Bertrand, M.; Duflo, E.; Mullainathan, S. (2004). "How Much Should We Trust Differences-in-Differences Estimates?" (PDF). Quarterly Journal of Economics. 119 (1): 249–275. doi:10.1162/003355304772839588. S2CID 470667.
  3. ^ Angrist, J. D.; Pischke, J. S. (2008). Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press. pp. 227–243. ISBN 978-0-691-12034-8.
  4. ^ Basu, Pallavi; Small, Dylan (2020). "Constructing a More Closely Matched Control Group in a Difference-in-Differences Analysis: Its Effect on History Interacting with Group Bias" (PDF). Observational Studies. 6: 103–130.
  5. ^ Bertrand, Marianne; Duflo, Esther; Mullainathan, Sendhil (2004). "How Much Should We Trust Differences-In-Differences Estimates?" (PDF). Quarterly Journal of Economics. 119 (1): 249–275. doi:10.1162/003355304772839588. S2CID 470667.
  6. ^ Card, David; Krueger, Alan B. (1994). "Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania". American Economic Review. 84 (4): 772–793. JSTOR 2118030.
  7. ^ Card, David; Krueger, Alan B. (1994). "Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania". American Economic Review. 84 (4): 772–793. JSTOR 2118030.

추가 읽기

외부 링크