차이의 차이에 대한 데이터 설정

다음을 사용하여 차이 회귀 모델의 차이에 맞는 설정

$Y_{ist} = \alpha +\gamma_s*T + \lambda d_t + \delta*(T*d_t)+ \epsilon_{ist}$

여기서 T는 관찰이 처리 그룹에서 온 경우 1과 동일한 더미이고 d는 처리가 발생한 후의 시간에서 1과 동일한 더미입니다.

1) 각 그룹과 시간에서 무작위 샘플 (즉, 4 무작위 샘플)

또는

2) 두 기간 동안 동일한 단위를 추적하는 패널 데이터는 무엇입니까?

중요합니까, 아니면 OLS를 어느 경우 에나 사용할 수 있습니까?

regression econometrics difference-in-difference

— B_ 광부
소스

나는 보지 못했다. (1)-분석은 항상 = (2)처럼 보인다. 왜 그런지 잘 모르겠습니다 (1). 그러나 나는 많은 DID 연구를 보지 못했습니다.

— 찰스

1의 예는 Wooldridge Introductory Econometrics 섹션 13.2

— B_Miner

차이 차이 (DID)의 주요 가정은 두 그룹이 치료 전 결과 변수에서 공통된 경향을 가지고 있다는 것입니다. 이것은 치료군에 대한 변경이 치료 때문이며 두 그룹이 이미 서로 다르기 때문이 아니라는 주장을하기 위해 중요합니다.

치료 전후에 다른 사람을 채취하면 치료 및 대조군의 시료가 실제로 무작위이고 크지 않은 한, 이는 논증을 약화시킵니다. 그래서 누군가가 당신에게 물어볼 것입니다. "효과가 다른 사람들을 샘플링했기 때문이 아니라 치료 때문인지 어떻게 확인할 수 있습니까?" -대답하기 어려울 것입니다. 이 질문은 시간이 지남에 따라 동일한 통계 단위를 추적하므로 일반적으로 더 확실한 접근 방식이므로 패널 데이터를 사용하여 피할 수 있습니다.

마지막 질문에 대답하려면 : 예 데이터는 중요하지만 위의 방정식을 추정하기 위해 반드시 OLS를 사용할 수 있습니다. 과거에 간과되었던 중요한 것은 표준 오차의 정확한 추정입니다. 이 값을 수정하지 않으면 직렬 상관 관계가 상당한 양으로이를 과소 평가하므로 아마해서는 안되지만 중대한 영향을받습니다. 이 문제를 다루는 방법에 대한 참조 및 제안으로 Bertrand et al. (2004) "차이 추정 차이를 얼마나 신뢰해야합니까?" .

마지막으로, 집계 데이터 (예 : 상태 수준)가 있거나 쉽게 집계 할 수 있고 DID보다 최신 계량 방법을 사용하려는 경우 Abadie et al. (2010) "비교 사례 연구를위한 합성 제어 방법" . 합성 제어 방법은 오늘날 연구에서 점점 더 많이 사용되고 있으며 R 및 Stata에 대한 문서화 된 루틴이 있습니다. 아마도 이것은 당신에게도 흥미로운 것입니다.

— 앤디
소스

대단한 앤디입니다! 두 가지 데이터 설정이 모두 가능하지만 패널 데이터가 가정에 대해 더 쉽게 주장 할 수 있다고 말하면 요약 할 수 있습니까? 둘 다 OLS에 맞을 수 있지만 직렬 상관 가능성으로 인해 (특히 추정되는 패널 데이터 설정) 표준 오류가 의심됩니다. Newey West SE의 패널 설정이 좋은 솔루션일까요?

— B_Miner

예, 첫 번째 데이터 유형의 경우 더 강력하고 강력한 가정이 필요합니다. 표준 오차의 경우 Newey West 보정이 작동해야합니다. 실제로 이것은 Bertrand et al.이 제안한 수정 방법 중 하나와 유사합니다. (클러스터 된 표준 오류를 사용합니다). 보다 최근의 방법은 꽤 잘 작동하는 부트 스트랩을 사용합니다 ( rbnz.govt.nz/research_and_publications/seminars_and_workshops/… 참조 ). 도움이 되었기를 바랍니다!

— Andy