답변:
첫 번째 질문에 답하기 위해 샘플 선택이 특정 형태의 내 생성이라는 것이 맞습니다 (내인성 및 일반적인 치료에 대한 기본 검토에 대해서는 Antonakis et al. 2010 참조). 그러나 치료 가능성에 대해서는 정확하지 않습니다. 이는 샘플 선택에서 내인성이있는 처리 변수 자체 ( "비 랜덤 처리 할당")이기 때문에 내생 변수입니다. 내 생성은 관찰 된“관계”가 실제로 X와 Y 모두에 영향을 미치는 다른 요인 Z에 기인 한 경우 요인 X와 요인 Y 사이의 인과 관계를 잘못 식별 한 상황을 나타냅니다. 회귀 모형을 고려할 때 다른 방식으로 :
내인성은 하나 이상의 예측 변수가 모형의 오차 항과 관련이있을 때 발생합니다. 즉, .
내인성의 일반적인 원인은 다음과 같습니다.
다른 유형의 문제에는 약간 다른 솔루션이 필요합니다. 이는 IV와 Heckman 유형 수정의 차이가 있습니다. 물론 이러한 방법의 기본 역학에는 차이가 있지만 전제는 동일합니다. 이상적으로 배제 제한, 즉 IV의 경우 하나 이상의 도구 또는 선택에 영향을 미치지 만 변수에는 영향을 미치지 않는 내 생성을 제거하는 것입니다. Heckman의 경우 결과.
두 번째 질문에 답하려면 이러한 솔루션의 개발을 야기한 데이터 제한 유형의 차이점에 대해 생각해야합니다. 저는 하나 이상의 변수가 내생적일 때 도구 변수 (IV) 접근 방식이 사용되며, 내 생성을 제거하기 위해 모형에 고수 할 좋은 프록시가 없지만 공변량과 결과가 모든 관측치에서 관찰된다고 생각합니다. 반면에 Heckman 유형 수정은 잘림이있을 때 사용됩니다. 즉, 선택 변수 값이 = 0 인 샘플의 정보는 관찰되지 않습니다.
도구 변수 (IV) 접근
2 단계 최소 제곱 (2SLS) 추정값을 사용한 IV 회귀 분석의 전형적인 계량 경제적 예를 생각해보십시오. 교육이 소득에 미치는 영향.
(1)
여기서 교육 성취도는 개인의 동기와 능력에 의해 부분적으로 결정되기 때문에 내생 적입니다. 두 가지 모두 개인의 수입에도 영향을 미칩니다. 동기 부여 및 능력은 일반적으로 가정 또는 경제 조사에서 측정되지 않습니다. 따라서 공식 1은 동기 부여와 능력을 명시 적으로 포함하도록 작성 될 수 있습니다.
(2)
이후 및 실질적으로 작성 가능 식 2 관찰되지 :
(3),
여기서 (4).
따라서 교육이 OLS를 통한 수입에 미치는 영향에 대한 순진한 추정은 편향 될 것입니다. 이 부분은 이미 알고 있습니다.
과거에 사람들은 부모의 교육을 유효한 도구에 대한 3 가지 요구 사항에 맞기 때문에 과목의 자체 교육 수준에 대한 도구로 사용했습니다. )에.
하면 (대상의 교육 견적되면 부모 교육 ()를 사용하여 M O m의 E의 D 및 D 차원 E의 D ) 첫번째 단계에서 및 (예측 교육의 값을 사용 ^ O를 승 N E의 D 추정치로) E R N I , N g 의 두 번째 단계에서는 추정 (매우 단순한 환산)이다 E에게 R을 N I , N g (S) 의 부분에 기초
Heckman 유형 수정
우리가 이전에 확립했듯이, 비 랜덤 샘플 선택은 특정 유형의 내 생성입니다. 이 경우 생략 된 변수는 표본에서 사람을 선택하는 방법입니다. 일반적으로 샘플 선택 문제가있는 경우 결과는 샘플 선택 대상에 대해서만 관찰됩니다.variable == 1
. 이 문제는 "사고 절단"이라고도하며 솔루션은 일반적으로 Heckman 수정이라고합니다. 계량 경제학의 전형적인 예는 기혼 여성의 임금 제안입니다.
(6)
(7)
That is, IFF and IFF
The solution here is therefore to predict the likelihood of participation in the labor force at first stage using a probit model and the exclusion restriction (the same criteria for valid instruments apply here), calculate the predicted inverse Mills ratio () for each observation, and in second stage, estimate the wage offer using the as a predictor in the model (Wooldridge 2009). If the coefficient on is statistically equal to zero, there is no evidence of sample selection (endogeneity), and OLS results are consistent and can be presented. If the coefficient on is statistically significantly different from zero, you will need to report the coefficients from the corrected model.
References
One should make a distinction between the specific Heckman sample selection model (where only one sample is observed) and Heckman-type corrections for self-selection, which can also work for the case where the two samples are observed. The latter is referred to as control function approach, and amounts to include into your second stage a term controlling for the endogeneity.
Let us have a standard case with an endogeneous dummy variable D, an instrument Z:
두 방법 모두 첫 번째 단계 (Z에서 D)를 실행합니다. IV는 표준 OLS를 사용합니다 (D가 더미 인 경우에도) Heckman은 프로 빗을 사용합니다. 그러나 이것 외에, 주요 차이점은 그들이 첫 번째 단계를 주요 방정식으로 사용하는 방식에 있습니다.
The advantage of the Heckman procedure is that it provides a direct test for endogeneity: the coefficient . On the other side, the Heckman procedure relies on the assumption of joint normality of the errors, while the IV does not make any such assumption.
So you have the standard story that with normal errors, the control function will be more efficient (especially if ones uses the MLE instead of the two-step shown here) than the IV, but that if the assumption does not hold, IV would be better. As researchers have become more suspicious about the assumption of normality, the IV is used more often.
Heckman, Urzua 및 Vytlacil (2006) :
선택 편향의 예 : 국가의 성과에 대한 정책의 영향을 고려한다 (예 : GDP). 정책이없는 경우에도 관찰 할 수없는 측면에서 잘 수행 한 국가가 정책을 채택한 국가 인 경우 OLS 추정치가 바이어스됩니다.
이 문제를 해결하기 위해 (a) 선택 모델과 (b) 도구 변수 모델이라는 두 가지 주요 접근 방식 이 채택되었습니다.
선택 방법은 조건부 평균 수준을 모델링합니다. IV 접근법은 조건부 평균의 기울기를 모델링합니다. IV는 선택 모델에서 추정 된 상수를 식별하지 않습니다.
IV 접근법은 D (치료)를 조건으로하지 않습니다. 선택 (제어 기능) 추정기는 제어 기능을 사용하여 조건부 수단을 식별합니다.
곡률 가정과 함께 제어 기능을 사용할 때 제외 제한 이 필요하지 않습니다 (필요하지 않음).)를 선택 모델에서 오차항의 분포를위한 기능적 형태를 가정함으로써, 결과 방정식의 조건 평균이 조건부 제어 함수와 같을 가능성을 배제하므로 배제 제한없이 선택을 수정할 수 있습니다. Heckman and Navarro (2004)도 참조하십시오.