"제어 변수"도 내생 성인 경우 어떻게됩니까?


13

저는 정치 경제에서 일하고 있으며, 많은 모델에는 인구, 불평등, 식민 유산 등의 "무고한"제어 변수가 포함되어있어 저자는 독립적 인 관심 변수에 대해 편견을 주장 할 수 있습니다.

그러나 이러한 제어 변수 중 일부가 생략 된 변수에 내생 적 인 경우 모든 독립 변수의 편견을 오염시키지 않습니까?

그것이 사실이라면, 우리는 무엇을 할 수 있습니까? 이러한 제어 변수를 제외하고 변수 바이어스 자체를 생략합니다. 그것들을 포함 시키면 모델의 모든 것을 오염시킬 것입니다.

예 : 연구원 폭력 경우 불평등 리드를 알고 싶어, 그는 몇 가지에 대한 제어 : 것을보고 불평등은 가능성이 내생 할 수 (인 생략 된 변수 이타주의 수준 때문에 ), 그는 불평등에 대한 도구 변수를 찾으려고 노력할 것이다 . 그러나 성장발전 은 내생적일 가능성이 높지 않습니까 (즉 , 이타주의 수준과 상관 관계가 있습니까)?

Violence=Inequality+Growth+Development+ϵ

이 예는 어리석게 보일지 모르지만 제 요점은 정치 경제 / 개발 작업에 있습니다 .LHS에 포함 된 많은 변수가 내생 적 인 것을 두려워하는 많은 요인이 있습니다 (아직 생략). 그러나 종종 연구원은 자신의 애완 동물 독립 변수에 대해서만 도구를 찾습니다.


고려해야 할 또 다른 사항은 소위 "나쁜 컨트롤"문제입니다. 즉 컨트롤이 결과 변수 자체 인 상황입니다. Angrist와 Pischke의 유명한 "무해한 계량 경제학"섹션 3.2.3을 읽고이 주제를 파악하고 질문에 대한 이해를 높이고 자하는 이유가 무엇인지 알아보십시오.
MauOlivares

답변:


10

"하지만 이러한 제어 변수 중 일부가 생략 된 변수에 내생 적이라면 모든 독립 변수의 편견을 오염시키지 않습니까?"

나는 이것을 너무 강조하고 싶지 않지만 이것이 일반적이지 않다는 것을 언급 할 가치가 있습니다. 다음의 유도는 여러분이 언급 한 "오염"에 대한 이해를 제공 할 것입니다. 간단한 반례로, 데이터 생성 프로세스가 의해 주어지고 여기서 는 관찰되지 . 하자 , , 및 . 그러면 가 "내인성" 이라는 것이 분명합니다 . 그러나 이므로 의 추정치 는 여전히 괜찮습니다. Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) 0 C o v ( X 1 , X 2 ) = 0 X 2 C o v ( X 1 ,

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0Cov(X2,Z)0Cov(X1,X2)=0X2β 1 plimCov(X1,Z)=0β1X * 1 =M2X1M2=[I-X2(X ' 2 X2)-1X ' 2 ]COV(X1,X2)=0X1 =X1Co
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
여기서 및 입니다. 때문에 , . 따라서 입니다.X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0X1=X1Cov(X1,Z)=0

"무엇을 할 수 있습니까?"

좋은 계량 경제학의 주요 과제 중 하나는 잠재적 인 식별 전략을 생각하는 것입니다. 설명하는 상황의 유형에서는 다른 방법으로 문제에 접근하려고 시도하는 것 외에는 아무것도 할 수 없습니다.


당신이 기술적으로 옳지 만이 점을 강조하지는 않겠습니다. 차라리 일반적으로, 우리의 biasedness 배제 할 수 없다고 말하고 싶지만 어떤 말하는 대신에, 변수를 일부 시나리오에서의 확인을 우리가 일반적으로 DGP를 알 수 없기 때문에, 음,.
FooBar

1) 가 이런 식으로 파생 된 참조를 알려 주 시겠습니까? 나는 계량 경제학에서 이것을 배우지 않았다. 2) 증거에서 을 어디에 사용 합니까? 그것은 것 같아 충분하다. 3) 나는 은 예외가 아니라 @FooBar에 동의합니다 . 실제로 를 처음 부터 제어하지 않아도 됩니다 (정밀도 증가 제외). COV(X1,Z)=0COV(X1,X-2)=0COV(X1,X2)=0COV(X1,X2)=0X2β^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0Cov(X1,X2)=0X2
Heisenberg

@FooBar에 동의합니다. 나는 이것이 특별한 경우임을 강조하기 위해 게시물을 업데이트했습니다. DGP를 모를 때까지는 사실입니다. 그러나 그것은 요점이 아닙니다. 모든 분석은 DGP에 대해 가정해야하며 분석의 품질은 가정의 품질에 따라 다릅니다. 내가 준 도출은 당신이 가고 싶은 곳으로 갈 수있는 가정 (예를 들어, 매우 강한 가정)의 예를 보여줍니다.
jmbejara

@Heisenberg : 1) 이것에 대해 새로운 질문을 주실 수 있습니까? 파생을 복사하여 붙여 넣고 질문을 제시하는 것이 가장 좋습니다. 2) 이라고 말할 때 이 필요합니다 . 3) 당신이 맞아요. 예측에 관심 이 있다면 중요 할 것입니다. 그러나, 그것은 좋은 지적입니다. 반면에 바이어스의 크기는 과 상관 관계에 따라 달라집니다 . C o v ( X 1 , Z ) = 0 Y X 1 X 2Cov(X1,Z)=0Cov(X1,Z)=0YX1X2
jmbejara

1
@jmbejara 1) 별도의 질문 으로 게시했습니다 . 이 경우 제목을 지능적이고 유용하게 Google 직원에게 표현하는 방법을 모르기 때문에 질문 / 제목을 자유롭게 편집하십시오.
Heisenberg


5

최소 제곱 추정의 맥락에서 회귀 변수의 가능한 내 생성을 다루기 위해 시도해야하는 방법은 도구 변수 추정을 통하는 것입니다. 이 접근법은 단지 하나의 내생 회귀를 갖는 것에 의존하지 않습니다. 이러한 경우에는 더 어려운 기기를 찾아야하지만 원칙적으로는이 방법이 동일하게 작동합니다.

IV 추정은 치우침 문제를 해결하지 않으며 추정기에 일관성을 제공합니다. 그러나 바이어스 바 엄격한 외인성 자체의 문제를 해결하는 것은 없습니다 (그리고 바이어스 감소 방법이 있습니다). 그러나 통계에 관한 다른 SE 사이트 인 Cross Validated 를 살펴보면, 노련한 통계 학자들이 편견없는 속성에 많은 비중을 두지 않는다는 것을 알게 될 것입니다. 큰 샘플 속성에 대한 일관성.


1
올바른 접근법은 실제로 모든 내생 변수에 대한 도구를 찾는 것입니다.
Heisenberg

1
그렇습니다.
Alecos Papadopoulos

5

통계 학자 앤드류 겔먼 (Andrew Gelman) 이 "중간 결과에 대한 통제의 잘못"이라고 부르는 것의 예이다 . 연구원이 더 많은 딸이 정치를 바꿀 수 있는지 물었을 때 나타나는이 오류에 대한 그의 설명은 다음과 같습니다. 두 번째 아이를 갖기로 한 결정은 반드시 첫 아이를 갖기로 한 이전의 결정에 조건부이므로 내생 적 인 결정 변수를 제어하는 ​​명확한 예처럼 보입니다.

지난 몇 년 동안 딸의 부모와 비교하여 아들의 부모의 경제적 결정을 살펴 보는 몇 가지 연구가 수행되었습니다 ....이 모든 연구의 공통된 특징은 총 자녀 수를 통제한다는 것입니다 ... 처음에는 총 어린이 수를 통제하는 것이 합리적으로 보입니다. 그러나 전체 어린이 수는 중간 결과이므로이를 통제 할 수 있습니다 (회복 모델에서 #kids를 기반으로 데이터를 하위 집합으로 설정하거나 #kids를 제어 변수로 사용하는지 여부). 아들 (또는 딸)을 갖는 인과 적 영향.

이것을보기 위해, 정치적으로 보수적 인 부모가 아들을 원할 가능성이 더 높고, 딸이 두 명인 경우, (가설 적으로) 세 번째 아이를 시험 할 가능성이 더 높다고 가정합니다. 이에 비해 자유주의는 두 딸에게 멈출 가능성이 더 큽니다. 이 경우 딸이 두 명인 가족에 대한 데이터를 보면 보수파가 과소 평가되며 딸이 전혀 영향을 미치지 않더라도 데이터는 정치적 자유주의와 딸의 상관 관계를 보여줄 수 있습니다! ...

해결책은 표준 보수적 (통계적 의미로) 접근 방법을 인과 추론에 적용하는 것인데, 이는 치료 변수 (성인의 성별)에 대해 회귀하지만 아이가 태어나 기 전에 일어나는 일에 대해서만 통제하는 것입니다. 예를 들어, 첫 아이가 여자 인 부모를 첫 아이가 남자 인 부모와 비교할 수 있습니다. 둘째 아이를 낳는 부모와 둘째 아이를 낳는 부모를 비교하여 둘째 아이를 볼 수도 있습니다. 세 번째 자녀 등도 마찬가지입니다.

아들을 갖는 것이 더 보수적인가? 그럴 수도 있고 아닐 수도있다. 중간 결과를 통제하는 문제

"제어 변수를 제외하고 변수 바이어스 자체를 생략하십시오"라는 의견에 따르면, 이것은 어떤 종류의 계측기를 얻는 지에 달려 있습니다. 요구 사항을 실제로 만족시키는 우수한 계측기 는 두 번째 단계의 오류 항과 독립적이어야하며 직접 제어하는 ​​다른 모든 것과는 독립적이어야합니다 . 즉,기구는 Y를 통해서만 Y를 바꿉니다. 따라서 폭력 방정식이 폭력의 구조적 방정식이라고 믿는다면 불평등을위한 적절한 도구는 성장과 발전과는 무관해야합니다.


1

다른 포스트가 지적했듯이, 내생 회귀 분석기는 회귀 분석기가 상관 될 때 회귀 분석에서 모든 매개 변수 추정치를 오염시킬 수 있습니다.

또한, 과 가 서로 연관되어 있고 는 내생 적이지만 은 그렇지 않은 상황을 상상하기 어려워 보일 수 있습니다 .X 2 X 2 X 1엑스1엑스2엑스2엑스1

그러나 가 내생 적이며 과 가 상관 된 경우에도 일관성을 보장하는 데 필요한 것보다 적습니다 .X2X1X2β^1엑스2엑스1엑스2

다음 모델을 고려하십시오 (@jmbejara의 표기법과 유사)

와이=엑스1β1+엑스2β2+γ+ε,

ε 1 관찰되지 않았으며, 일반적인 외인성 가정 wrt , 즉 및 모든 회귀 자에 대해 입니다 . 는 이라는 의미에서 내생 적 입니다. 변수 .ε11엑스1(케이)'ε0kX211엑스2(케이)'ε0케이엑스2(k,l)1nx1(k)z(l)p0(k,l)

가 내생 적이지만 이 제어 한 후 과 사이의 모든 상관 관계 가 사라진다 는 의미가 아닌 경우X 1 X 1 Z X 2X2X1X1ZX2 , 즉

(K,L)QX2X2QX2[IN-X2(X ' 2 X2)-1X ' 2 ]β1

1nx1(k)QX2z(l)p0
모두 , 여기서 는 (``잔여 제작자 '') 의 null 공간에 대한 투영입니다 . 즉 그럼 괜찮습니다. 그 이유는 다음과 같은 의 2 단계 추정기 (예 : Amemiya, 1985, 6-7 페이지)에서 볼 수 있습니다.(k,l)QX2X2QX2[InX2(X2X2)1X2]β1

X1X2

β^1=(엑스1'엑스2엑스1)1엑스1'엑스2와이=β1+(엑스1'엑스2엑스1)1엑스1'엑스2엑스20β2+(엑스1'엑스2엑스1)1엑스1'엑스20γ+(엑스1'엑스2엑스1)1엑스1'엑스2ε0
QED. 여기의 세 번째 줄은 핵심이며 과 가 상관되지 직교 할 때 왜 우리가 안전한지 보여줍니다 . 행복한 내생 회귀.엑스1엑스2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.