다음을 사용하여 차이 회귀 모델의 차이에 맞는 설정
여기서 T는 관찰이 처리 그룹에서 온 경우 1과 동일한 더미이고 d는 처리가 발생한 후의 시간에서 1과 동일한 더미입니다.
1) 각 그룹과 시간에서 무작위 샘플 (즉, 4 무작위 샘플)
또는
2) 두 기간 동안 동일한 단위를 추적하는 패널 데이터는 무엇입니까?
중요합니까, 아니면 OLS를 어느 경우 에나 사용할 수 있습니까?
다음을 사용하여 차이 회귀 모델의 차이에 맞는 설정
여기서 T는 관찰이 처리 그룹에서 온 경우 1과 동일한 더미이고 d는 처리가 발생한 후의 시간에서 1과 동일한 더미입니다.
1) 각 그룹과 시간에서 무작위 샘플 (즉, 4 무작위 샘플)
또는
2) 두 기간 동안 동일한 단위를 추적하는 패널 데이터는 무엇입니까?
중요합니까, 아니면 OLS를 어느 경우 에나 사용할 수 있습니까?
답변:
차이 차이 (DID)의 주요 가정은 두 그룹이 치료 전 결과 변수에서 공통된 경향을 가지고 있다는 것입니다. 이것은 치료군에 대한 변경이 치료 때문이며 두 그룹이 이미 서로 다르기 때문이 아니라는 주장을하기 위해 중요합니다.
치료 전후에 다른 사람을 채취하면 치료 및 대조군의 시료가 실제로 무작위이고 크지 않은 한, 이는 논증을 약화시킵니다. 그래서 누군가가 당신에게 물어볼 것입니다. "효과가 다른 사람들을 샘플링했기 때문이 아니라 치료 때문인지 어떻게 확인할 수 있습니까?" -대답하기 어려울 것입니다. 이 질문은 시간이 지남에 따라 동일한 통계 단위를 추적하므로 일반적으로 더 확실한 접근 방식이므로 패널 데이터를 사용하여 피할 수 있습니다.
마지막 질문에 대답하려면 : 예 데이터는 중요하지만 위의 방정식을 추정하기 위해 반드시 OLS를 사용할 수 있습니다. 과거에 간과되었던 중요한 것은 표준 오차의 정확한 추정입니다. 이 값을 수정하지 않으면 직렬 상관 관계가 상당한 양으로이를 과소 평가하므로 아마해서는 안되지만 중대한 영향을받습니다. 이 문제를 다루는 방법에 대한 참조 및 제안으로 Bertrand et al. (2004) "차이 추정 차이를 얼마나 신뢰해야합니까?" .
마지막으로, 집계 데이터 (예 : 상태 수준)가 있거나 쉽게 집계 할 수 있고 DID보다 최신 계량 방법을 사용하려는 경우 Abadie et al. (2010) "비교 사례 연구를위한 합성 제어 방법" . 합성 제어 방법은 오늘날 연구에서 점점 더 많이 사용되고 있으며 R 및 Stata에 대한 문서화 된 루틴이 있습니다. 아마도 이것은 당신에게도 흥미로운 것입니다.