도구 변수 란 무엇입니까?


36

응용 경제 및 통계에서 도구 변수가 점점 일반화되고 있습니다. 처음에는 다음 질문에 대한 기술적이지 않은 답변을 얻을 수 있습니다.

  1. 도구 변수 란 무엇입니까?
  2. 언제 도구 변수를 사용하고 싶습니까?
  3. 도구 변수를 어떻게 찾거나 선택합니까?

4
Wikipedia 기사가 충분하다고 생각하지 않습니까?

1
이와 같은 질문에는 위키 / 블로그 게시물 유형의 응답이 필요합니다. 질문에 긴 답변이 필요하지 않다고 생각합니다.

올바른 질문은이 질문을 무시하고 위키를 참조하는 것입니다. 특히 베타 사이트에서 사이트의 내용을 작성하려는 경우에는 특히 그렇습니다. 아마도 질문 담당자는 각 질문을 개별적으로 제출하여 더 잘 해결할 수 있도록해야합니다.
russellpierce

3
@mbq-위키 백과 예제는 기술이 아닌 것으로 평가되지 않습니다. 전문 용어와 방정식에 매우 의존합니다.
rolando2

1
1980 년대에 어느 정도 경제에서 보편화되었습니다. 일부 바이오 스태틱 (biostatic) 전문가들도이 장비를 듣고 측정 오차 모델과 관련하여 장비를 추가 측정으로 좁히고 있습니다. 그들은 더 넓은 계량 경제적 맥락에서 도구로서 자격이있다 : 그것들은 관심 변수와 상관 관계가 있으며, 측정 오차와 상관이 없다.
StasK

답변:


41

[다음은 아마도 방정식을 사용하기 때문에 약간 기술적으로 보이지만 주로 화살표 차트를 기반으로 직 감성을 제공하기 때문에 OLS에 대한 기본적인 지식 만 필요하므로 격파하지 마십시오.]

당신의 인과 효과 추정한다고 가정 의 에 대한 추정 계수에 의해 주어진 하지만, 어떤 이유로 당신의 설명 변수와 오차항 사이에 상관 관계가있다 :y i βxiyiβ

yi=α+βxi+ϵicorr

이것은 와 관련된 중요한 변수를 포함하는 것을 잊었 기 때문에 발생했을 수 있습니다 . 이 문제를 생략 된 변수 바이어스라고합니다. 그러면 가 원인 효과를 제공하지 않습니다 (자세한 내용은 여기 참조). 기기를 사용하고 싶을 때만 진정한 원인 효과를 찾을 수 있기 때문입니다.βxiβ^

인스트루먼트는 새로운 변수이다 상관 함께 ,하지만 상관 관계와 잘 및에만 영향을 통해 - 우리의 악기는 "외인성"라고 불리는 그래서. 여기이 차트와 같습니다 :ϵ i x i y i x iziϵixiyixi

zixiyiϵi

이 새로운 변수를 어떻게 사용합니까?
종속 변수의 전체 변형을 설명 및 설명 할 수없는 구성 요소로 분할하는 회귀 분석 뒤에 분산 분석 유형 아이디어를 기억할 수 있습니다. 예를 들어 계측기에서 를 회귀 분석하면xi

xitotal variation=a+πziexplained variation+ηiunexplained variation

여기 설명 된 변형은 외생 변수 에만 의존하기 때문에 원래 방정식과 외생 있습니다. 따라서 이러한 의미에서 를 외인성이 있다고 주장 할 수있는 부분 ( 의존하는 부분 )과 와 관련된 모든 나쁜 변형을 유지하는 설명 할 수없는 부분 . 이제 우리는이 회귀의 외생적인 부분을 라고 부릅니다 .zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

이것을 원래 회귀 분석에 넣습니다.

yi=α+βx^i+ϵi

이제 는 더 이상 와 상관 관계가 없기 때문에 ( 에서이 부분을 "필터링하여" 남겨 두었다는 것을 ), 기기가 중단되는 데 도움이 되었기 때문에 지속적으로 추정 할 수 있습니다. 설명과 변수의 상관 관계 이것은 도구 변수를 적용하는 방법 중 하나입니다. 중 회귀 여기서이 방법은 실제로 2 단계 최소 제곱이라고 의 "첫 단계"라고 여기에서 마지막 등식은 "두 번째 단계"라고한다.x^iϵixiηiβxizi

원래 그림의 관점에서 (내가 엉망이되지 않도록 를 생략 하지만 거기에 있음을 기억하십시오!) 에서 직접적이지만 결함이있는 경로를 취하는 대신 통해 중간 단계를 수행했습니다.ϵixiyix^i

x^izixiyi

인과 관계로가는 길의 약간의 전환 덕분에 우리는 이 도구를 사용하여 를 일관되게 추정 할 수있었습니다 . 이 전환의 비용은 도구 변수 모델이 일반적으로 정확도가 낮기 때문에 표준 오류가 더 큰 경향이 있음을 의미합니다.β

악기는 어떻게 찾습니까? 가 와 상관 관계가없는
이유에 대해 좋은 사례를 만들어야하기 때문에 쉬운 질문 이 아닙니다 . 실제 오류가 관찰되지 않으므로 공식적으로 테스트 할 수 없습니다. 따라서 가장 큰 도전은 자연 재해, 정책 변경, 때로는 무작위 실험을 실행할 수있는 것과 같이 외생적인 것으로 보일 수있는 것을 생각해내는 것입니다. 다른 답변에는 이에 대한 좋은 예가 있으므로이 부분을 반복하지 않겠습니다.ϵ ziϵi


10
+1 마지막으로 참조 또는 링크 목록 대신 자세한 답변을 읽어 주셔서 감사합니다.
whuber

1
우수한! 나는 xepsilon의 관찰되지 않은 요소들에 의해 가 중독 / 오염 되었기 때문에 이것을 학생들에게보다 "니 모니 컬하게"설명 . 1 단계 회귀는 에서 독을 "청소"/ 흡입합니다 . 의 "정리 된"버전을 사용하여 인과 계수 를 찾을 수 있습니다. ϵ x x βxϵxxβ
MichaelChirico

대한 2SLS 추정치 가 일관된 이유가 직관적 입니까? 우리가 계산할 때 , 우리의 일부 "필터링"하는 오류와 관련되어 있지만, 이유는 필터링이 변경되지 않습니다해야 우리의 추정치를 변경하는 방법으로 ? XX X ββx^ixixiβ
user35734

여기를 참조하십시오 : stats.stackexchange.com/questions/64279/… 새로운 질문을하고 싶을 수도 있습니다. 도움이 되었기를 바랍니다.
Andy

@ user35734 일관성이 없지만 점증 적으로 일관성이 있습니다.
Vim

17

경제학에 대한 사전 지식이없는 의학 통계 학자로서 나는 종종 그들의 예를 따르려고 애 쓰고 그들의 다른 용어 (예 : '내인성', ','구조 방정식 ','생략 된 변수 '). 다음은 내가 유용하다고 생각한 몇 가지 참고 자료입니다 (첫 번째는 무료로 사용할 수 있어야하지만 다른 사람들은 구독을 요구할 수도 있습니다).

또한 4 장을 추천합니다 :


11

다음은 UC 버클리에서 계량 경제학 코스를 위해 준비한 슬라이드입니다. 도움이 되셨기를 바랍니다. 귀하의 질문에 답변하고 몇 가지 예를 제시합니다.

내 웹 사이트의 PS 236 및 PS 239 (대학원 수준의 정치 과학 방법 과정)에 대한 코스 페이지에는 고급 치료법이 있습니다. http://gibbons.bio/teaching.html .

야경


버클리 슬라이드에 대한 링크가 더 이상 유효하지 않습니다.
rolando2

7

비 기술적 (보통 그게 전부입니다) : X가 Y를 유발할뿐만 아니라 Y도 X를 유발하는 경우가 있습니다. 도구 변수는이 지저분한, 불편한 관계를 "정리"하여 X에 대한 X의 영향을 Y로 추정 할 수있는 장치입니다.

도구 변수는 관계로 인해 선택됩니다. X의 원인이지만 X를 통한 동작 외에는 Y에 영향을주지 않습니다. 도구 (또는 도구)는 1 단계에서 새 "버전을 계산하는 데 사용됩니다. X의 ", Y의 함수는 아닙니다.이 새로운"예측 된 "X는 더 표준적인 회귀에서 두 번째 단계에서 Y를 설명 / 예측하는 데 사용됩니다. 따라서 2 단계 최소 제곱 회귀라는 용어 .

일반적으로 법률, 정책, 자연 행위 등에 의존하는 변수와 같이 X 또는 Y의 통제를 무시하거나 초과하는 프로세스에서 IV를 찾습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.