이것은 계량 경제학에서 선택 모델의 변형입니다. 여기서 선택된 표본 만 사용한 추정치의 유효성은
. 여기 것입니다 의 질병 상태.Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Dii
자세한 내용을 보려면 다음 표기법을 정의하십시오.
및 ; 은 가 샘플에있는 이벤트를 나타냅니다 . 또한, 는 단순성을 위해 와 무관 하다고 가정 합니다.π1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi
표본 의 단위 에 대한 의 확률 은
의해 반복 된 만기 법이 적용됩니다. 질병 상태 및 기타 공변량 에 대해 조건부로 가정 하면 결과
는 무관 합니다. 결과적으로
Yi=1i
Pr(Yi=1∣Xi,Si=1)===E(Yi∣Xi,Si=1)E{E(Yi∣Xi,Di,Si=1)∣Xi,Si=1}Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1,Si=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0,Si=1),
DiXiYiSiPr(Yi=1∣Xi,Si=1)=Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0).
그것은 쉽게 볼 그
여기서 및 은 샘플링 체계에 정의 된대로입니다. 그러므로,
Pr(Di=1∣Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0∣Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1∣Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1∣Xi,Di=0).
경우 ,
샘플 선택 문제를 생략 할 수 있습니다. 반면, ,
일반적으로 특별한 경우 로짓 모델을 고려하십시오.
Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)=Pr(Yi=1∣Xi),
Pr(Yi=1∣Xi,Di=1)≠Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)≠Pr(Yi=1∣Xi)
Pr(Yi=1∣Xi,Di=1)=eX′iα1+eX′iα and Pr(Yi=1∣Xi,Di=0)=eX′iβ1+eX′iβ.
때에도 및 통해 일정한 , 얻어진 분포 로짓 형성을 유지할 것이다. 더 중요한 것은 매개 변수의 해석이 완전히 다를 것입니다. 위의 주장이 문제를 좀 더 명확히하는 데 도움이되기를 바랍니다.
pi1pi0i
추가 설명 변수로 를 포함 시키고 에 따라 모형을 추정 하려고합니다 . 사용의 타당성을 정당화하기 위해 , 우리가 입증 할 필요가 , 이는 는 의 충분한 통계량입니다 . 샘플링 프로세스에 대한 추가 정보가 없으면 그것이 사실인지 잘 모르겠습니다. 추상 표기법을 사용합시다. 관측 변수 는 의 임의 함수 와 다른 임의 변수 로 볼 수 있습니다.DiPr(Yi∣Xi,Di)Pr(Yi∣Xi,Di)Pr(Yi∣Xi,Di,Si=1)=Pr(Yi∣Xi,Di)DiSiSiDiZi . 나타내고 . 경우
의 독립적 인 조건으로 및 , 우리가
독립의 정의에 의해. 그러나 및 에서 컨디셔닝 한 후 가 무관 한 경우
직관적으로
이며 일반적으로Si=S(Di,Zi)ZiYiXiDiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)ZiYiXiDiZiYiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di) . 따라서 '그러나'경우, 표본 선택의 무지는 추론으로 오도 될 수있다. 계량 경제학의 샘플 선택 문헌에 익숙하지 않습니다. Microeconometrics: methods and applications' by Cameron
and Trivedi (especially the Roy model in that chapter). Also G. S.
Maddala's classic book
계량 경제학 의 제한적 의존성 및 질적 변수의 16 장을 추천한다. '는 표본 선택과 불연속 결과에 대한 문제를 체계적으로 처리하는 것이다.