2 단계 모델 : Heckman 모델 (샘플 선택 처리)과 기기 변수 (내인성 처리)의 차이점


16

나는 샘플 선택과 내 생성의 차이에 대해 고심하려고 노력하고 있으며, 결과적으로 Heckman 모델 (샘플 선택을 처리하기 위해)이 내 생성을 처리하기 위해 도구 변수 회귀와 어떻게 다른지에 대해 노력하고 있습니다.

내생 변수가 치료 될 가능성이있는 경우, 시료 선택이 특정 형태의 내인성이라고 말하는 것이 맞습니까?

또한 Heckman 모델과 IV 회귀 모두 2 단계 모델이며, 첫 번째 단계는 치료 가능성을 예측합니다. 실험적으로 수행하는 작업, 목표 및 가정에 따라 달라져야한다고 가정합니다. 그러나 어떻게?

답변:


23

첫 번째 질문에 답하기 위해 샘플 선택이 특정 형태의 내 생성이라는 것이 맞습니다 (내인성 및 일반적인 치료에 대한 기본 검토에 대해서는 Antonakis et al. 2010 참조). 그러나 치료 가능성에 대해서는 정확하지 않습니다. 이는 샘플 선택에서 내인성이있는 처리 변수 자체 ( "비 랜덤 처리 할당")이기 때문에 내생 변수입니다. 내 생성은 관찰 된“관계”가 실제로 X와 Y 모두에 영향을 미치는 다른 요인 Z에 기인 한 경우 요인 X와 요인 Y 사이의 인과 관계를 잘못 식별 한 상황을 나타냅니다. 회귀 모형을 고려할 때 다른 방식으로 :

와이나는=β0+β1엑스나는+...+ϵ나는

내인성은 하나 이상의 예측 변수가 모형의 오차 항과 관련이있을 때 발생합니다. 즉, .Cov(x,ϵ)0

내인성의 일반적인 원인은 다음과 같습니다.

  1. 생략 된 변수 (우리가 측정 할 수없는 것)
    • 동기 부여 / 선택
    • 능력 / talent
    • 자기 선택
  2. 측정 오류 (우리는 포함시킬 하지만, 우리는 관찰 X J * )xjxj
  3. 동시성 / 양방향성 (5 세 미만 어린이의 경우 영양 상태 표시기“나이 체중”)와 아동이 최근 질병을 앓고 있었는지의 관계는 동시적일 수 있습니다.

다른 유형의 문제에는 약간 다른 솔루션이 필요합니다. 이는 IV와 Heckman 유형 수정의 차이가 있습니다. 물론 이러한 방법의 기본 역학에는 차이가 있지만 전제는 동일합니다. 이상적으로 배제 제한, 즉 IV의 경우 하나 이상의 도구 또는 선택에 영향을 미치지 만 변수에는 영향을 미치지 않는 내 생성을 제거하는 것입니다. Heckman의 경우 결과.

두 번째 질문에 답하려면 이러한 솔루션의 개발을 야기한 데이터 제한 유형의 차이점에 대해 생각해야합니다. 저는 하나 이상의 변수가 내생적일 때 도구 변수 (IV) 접근 방식이 사용되며, 내 생성을 제거하기 위해 모형에 고수 할 좋은 프록시가 없지만 공변량과 결과가 모든 관측치에서 관찰된다고 생각합니다. 반면에 Heckman 유형 수정은 잘림이있을 때 사용됩니다. 즉, 선택 변수 값이 = 0 인 샘플의 정보는 관찰되지 않습니다.

도구 변수 (IV) 접근

2 단계 최소 제곱 (2SLS) 추정값을 사용한 IV 회귀 분석의 전형적인 계량 경제적 예를 생각해보십시오. 교육이 소득에 미치는 영향.

(1)이자형아르 자형나는에스나는=β0+β1영형이자형나는+ϵ나는

여기서 교육 성취도는 개인의 동기와 능력에 의해 부분적으로 결정되기 때문에 내생 적입니다. 두 가지 모두 개인의 수입에도 영향을 미칩니다. 동기 부여 및 능력은 일반적으로 가정 또는 경제 조사에서 측정되지 않습니다. 따라서 공식 1은 동기 부여와 능력을 명시 적으로 포함하도록 작성 될 수 있습니다.

(2)이자형아르 자형나는에스나는=β0+{β1영형이자형나는+β2미디엄영형나는V나는+β나는나는}+ϵ나는

이후 미디엄영형나는V 실질적으로 작성 가능 식 2 관찰되지 :나는

(3),이자형아르 자형나는에스나는=β0+β1영형이자형나는+나는

여기서 (4).나는=β2미디엄영형나는V나는+β나는나는+ϵ나는

따라서 교육이 OLS를 통한 수입에 미치는 영향에 대한 순진한 추정은 편향 될 것입니다. 이 부분은 이미 알고 있습니다.

과거에 사람들은 부모의 교육을 유효한 도구에 대한 3 가지 요구 사항에 맞기 때문에 과목의 자체 교육 수준에 대한 도구로 사용했습니다. )에.

  1. 는 내인성 예측 변수와 관련이 있어야합니다 – 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) 0 ,𝐶𝑜𝑣(𝑧,𝑥)0
  2. - 직접 결과에 관련 될 수 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0 , 및𝐶𝑜𝑣(𝑧,𝑦)=0
  3. 는 관찰 할 수없는 (u) 특성과 관련 될 수 없습니다 (즉, z 는 외인성) – 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0𝐶𝑜𝑣(𝑧,𝑢)=0

하면 (대상의 교육 견적되면 부모 교육 ()를 사용하여 M O m의 E의 DD 차원 E의 D ) 첫번째 단계에서 및 (예측 교육의 값을 사용 ^ O를 N E의 D 추정치로) E R N I , N g 두 번째 단계에서는 추정 (매우 단순한 환산)이다 E에게 R을 N I , N g (S) 의 부분에 기초영형이자형미디엄영형미디엄이자형이자형영형이자형^이자형아르 자형나는에스이자형아르 자형나는에스영형이자형

Heckman 유형 수정

우리가 이전에 확립했듯이, 비 랜덤 샘플 선택은 특정 유형의 내 생성입니다. 이 경우 생략 된 변수는 표본에서 사람을 선택하는 방법입니다. 일반적으로 샘플 선택 문제가있는 경우 결과는 샘플 선택 대상에 대해서만 관찰됩니다.variable == 1 . 이 문제는 "사고 절단"이라고도하며 솔루션은 일반적으로 Heckman 수정이라고합니다. 계량 경제학의 전형적인 예는 기혼 여성의 임금 제안입니다.

이자형나는=β0+β1이자형나는+β2이자형엑스이자형아르 자형나는이자형이자형나는+β이자형엑스이자형아르 자형나는이자형이자형나는2+ϵ나는

이자형에스

Wagei=Xβ+ϵi (6)

LaborForcei=Zγ+νi (7)

That is, Wage=Wagei IFF LaborForcei>0 and Wage=. IFF LaborForcei0

The solution here is therefore to predict the likelihood of participation in the labor force at first stage using a probit model and the exclusion restriction (the same criteria for valid instruments apply here), calculate the predicted inverse Mills ratio (λ^) for each observation, and in second stage, estimate the wage offer using the λ^ as a predictor in the model (Wooldridge 2009). If the coefficient on λ^ is statistically equal to zero, there is no evidence of sample selection (endogeneity), and OLS results are consistent and can be presented. If the coefficient on λ^ is statistically significantly different from zero, you will need to report the coefficients from the corrected model.

References

  1. Antonakis, John, Samuel Bendahan, Philippe Jacquart, and Rafael Lalive. 2010. “On Making Causal Claims: A Review and Recommendations.” The Leadership Quarterly 21 (6): 1086–1120. doi:10.1016/j.leaqua.2010.10.010.
  2. Wooldridge, Jeffrey M. 2009. Introductory Econometrics: A Modern Approach. 4th ed. Mason, OH, USA: South-Western, Cengage Learning.

1
In Heckman-type correction, how to interprete inverse Mills ratio values for each observation? Does it says the number of people who will work from the non-working population at a given moment?
Quirik

2

One should make a distinction between the specific Heckman sample selection model (where only one sample is observed) and Heckman-type corrections for self-selection, which can also work for the case where the two samples are observed. The latter is referred to as control function approach, and amounts to include into your second stage a term controlling for the endogeneity.

Let us have a standard case with an endogeneous dummy variable D, an instrument Z:

와이=β+β1+ϵ
=γ+γ1+

두 방법 모두 첫 번째 단계 (Z에서 D)를 실행합니다. IV는 표준 OLS를 사용합니다 (D가 더미 인 경우에도) Heckman은 프로 빗을 사용합니다. 그러나 이것 외에, 주요 차이점은 그들이 첫 번째 단계를 주요 방정식으로 사용하는 방식에 있습니다.

  • IV : D를 관련이없는 부분으로 분해하여 내 생성을 파괴ϵD의 예측에 의해 주어진다 : 와이=β+β1^+ϵ
  • Heckman : 내 생성을 모델링합니다. 내인성 D를 유지하지만 첫 단계의 예측 된 값의 기능을 추가합니다. 이 경우 매우 복잡한 기능입니다.Y=β+β1D+β2[λ(D^)λ(D^)]+ϵ where λ() is the inverse Mills ratio

The advantage of the Heckman procedure is that it provides a direct test for endogeneity: the coefficient β2. On the other side, the Heckman procedure relies on the assumption of joint normality of the errors, while the IV does not make any such assumption.

So you have the standard story that with normal errors, the control function will be more efficient (especially if ones uses the MLE instead of the two-step shown here) than the IV, but that if the assumption does not hold, IV would be better. As researchers have become more suspicious about the assumption of normality, the IV is used more often.


0

Heckman, Urzua 및 Vytlacil (2006) :

선택 편향의 예 : 국가의 성과에 대한 정책의 영향을 고려한다 (예 : GDP). 정책이없는 경우에도 관찰 할 수없는 측면에서 잘 수행 한 국가가 정책을 채택한 국가 인 경우 OLS 추정치가 바이어스됩니다.

이 문제를 해결하기 위해 (a) 선택 모델과 (b) 도구 변수 모델이라는 두 가지 주요 접근 방식 이 채택되었습니다.

선택 방법은 조건부 평균 수준을 모델링합니다. IV 접근법은 조건부 평균의 기울기를 모델링합니다. IV는 선택 모델에서 추정 된 상수를 식별하지 않습니다.

IV 접근법은 D (치료)를 조건으로하지 않습니다. 선택 (제어 기능) 추정기는 제어 기능을 사용하여 조건부 수단을 식별합니다.

곡률 가정과 함께 제어 기능을 사용할 때 제외 제한 이 필요하지 않습니다 (필요하지 않음).엑스)를 선택 모델에서 오차항의 분포를위한 기능적 형태를 가정함으로써, 결과 방정식의 조건 평균이 조건부 제어 함수와 같을 가능성을 배제하므로 배제 제한없이 선택을 수정할 수 있습니다. Heckman and Navarro (2004)도 참조하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.