“내 생성”과“외 생성”은 실질적으로 무엇을 의미합니까?


43

내생의 기본 정의는 이 만족되지 않는다는 것을 이해합니다. 그러나 이것이 실제 의미에서 무엇을 의미합니까? 나는 수요와 공급의 예를 가지고 Wikipedia 기사를 읽었지만 그것을 이해하려고 노력했지만 실제로는 도움이되지 않았습니다. 내생 및 외생에 대한 다른 설명은 시스템 내부와 시스템 외부에 있으며 여전히 이해가되지 않는 것으로 들었습니다.

Xϵ=0

1
아래의 세 가지 답변은 모두 +1입니다. 다른 정보원을 원한다면 여기 에서 b 1 x 1 + b 2 x 2 + b 3 x 3 대신 b 1 x 1 + b 2 x 2추정b1x1+b2x2b1x1+b2x2+b3x3 하고 시뮬레이션으로 설명하십시오 R.
gung-복직 모니카

1
내 생성이 있으면 회귀 분석에 더 이상 사용할 수있는 추정 기나 테스트 통계가 없습니다.
Ivan

1
@gung에 동의하며 전체 답변이 " 어떤 목적으로 사용할 수 있습니까? "라고 답하고 싶습니다 . 위의 답변 중 많은 부분 이이 질문을 잘 처리합니다.
Matthew Drury

@Matthew이 게시물은 "실제 세계 의미에서 이것이 무엇을 의미합니까?"라는 질문에 대한 답변을 시도하는 것 같습니다. 사람들이 더 잘 이해할 수 있도록 설명이 잘 나오는 것이 좋을 것입니다.
whuber

@ whuber 몰라, 정말 말할 수없는 너무 짧습니다. 그러나 예를 들어, 추정 된 모델이 내 생성을 가지고 있어도 예측 (또는 단지 연관)에 유용 할 수 있다고 생각했기 때문에 "사용할 수있는 추정기가 더 이상 없다"는 설명 없이는 거짓으로 보입니다.
Matthew Drury

답변:


68

JohnRos의 답변은 매우 좋습니다. 일반 영어로, 내 생성은 원인이 잘못되었음을 의미합니다. 적어 놓고 추정 한 모델이 현실에서 인과 관계가 작동하는 방식을 제대로 포착하지 못하고 있습니다. 당신이 쓸 때 :

Yi=β0+β1Xi+ϵi

이 방정식을 여러 가지 방법으로 생각할 수 있습니다. X 값을 기반으로 를 예측하는 편리한 방법으로 생각할 수 있습니다. 편리한 모델링 방법으로 생각할 수 있습니다. E { Y | X } . 이 두 가지 경우 모두 내 생성과 같은 것은 없으며 걱정할 필요가 없습니다.YXE{Y|X}

그러나 방정식을 인과 관계를 구현하는 것으로 생각할 수도 있습니다. 당신은 생각할 수 질문에 대한 답으로 "에 어떤 일이 일어날 것이라고 Y 나는이 시스템에 도달하고 실험적으로 증가하면 X를 ? 1" 그렇게 생각하고 싶다면 OLS를 사용하여 다음과 같이 가정하십시오.β1YX

  1. Y를 일으킨다XY
  2. 발생 Y를ϵY
  3. X를 유발하지 않습니다ϵX
  4. X를 유발하지 않습니다YX
  5. 를 유발 하는 것도 X 를 유발하지 않습니다ϵX

3-5 중 하나라도 실패하면 일반적으로 확실히 동등하거나, C O V ( X , ε ) 0 . 도구 변수는 원인이 잘못되었다는 사실을 수정하는 방법입니다 (다른, 다른 인과 적 가정을 만들어서). 완벽 실시 무작위 통제 재판의 방법입니다 강제 사실로 3-5. 당신이 선택하면 X를 무작위로, 다음은 확인에 의해 발생한 것이 Y , εE{ϵ|X}0Cov(X,ϵ)0XYϵ또는 다른 것. 소위 "자연 실험"방법은 3-5가 사실이라고 생각하지 않더라도 3-5가 참인 세상에서 특별한 상황을 찾으려는 시도입니다.

JohnRos의 예에서 교육의 임금 가치를 계산하려면 의 인과적인 해석이 필요 하지만 3 또는 5가 거짓이라고 믿을만한 충분한 이유가 있습니다.β1

그래도 혼란은 이해할 수 있습니다. 그것은의 인과 적 해석에 사용하는 강사에 대한 선형 모델에 과정에서 매우 전형적인 척,없는 척 원인을 도입 할 때 내가 위에서 준 "은 모든 단지 통계의를." 겁쟁이 거짓말이지만 매우 흔합니다. β1

실제로, 그것은 생물 의학과 사회 과학에서 더 큰 현상의 일부입니다. 거의 항상 우리의 인과 효과를 확인하고자하는 경우입니다 Y를 어떤 과학의 모든 후 약이다 ---. 반면에, 당신은 3-5 중 하나가 틀렸다는 결론을 이끌어 낼 수있는 이야기가있는 경우가 거의 항상 있습니다. 따라서 우리는 단지 연관 작업을하고 있다고 말함으로써 반대 의견을 피할 수있는 일종의 실용적이고 유동적이며 부정직 한 부정직이 있습니다.XY

정말로 관심이 있다면 읽을 사람은 Judea Perl입니다. James Heckman도 좋습니다.


5
+1 훌륭한 설명과 해설. 우리 사이트에 오신 것을 환영합니다!.
whuber

2
이 문제에 대한 기본적이고 탄탄한 이해를 얻기 위해 Heckman이 어떤 작업을 추천했는지 말씀해 주시겠습니까?
Kenny LJ

E[ϵ|X]=0E[ϵX]=0E[ϵ|X]=0E[ϵX]=0ϵ
KevinKim

1
E{ϵ|X}=0ϵE{ϵ|X}=0E{ϵ|X}=0Cov{X,e}=0eE{ϵ|X}=0

2
@KevinKim 맞습니다. 그리고 이것은 선형 모델이 아닙니다. 모든 통계입니다. 사람이 말할 때주의 사항은, 그들은 지금 무엇을 말할에 갈 수 없다 "상관 관계는 인과 아니다" 이다 원인. 인과 관계는 이론이며 이론 일 뿐이다. 심지어 (완전히-전도 적이 지 않은) RCT조차 이론 없이는 인과 관계를 알려주지 않습니다.
Bill

18

예를 들어 보겠습니다.

소득에 대한 교육의 (인과 적) 영향을 정량화한다고 가정하십시오. 교육 연도 및 소득 데이터를 가져 와서 다른 것에 대해 회귀합니다. 당신이 원하는 것을 회복 했습니까? 아마 아닙니다! 수입은 교육 이외의 것이지만 교육과 관련이 있기 때문입니다. "기술"이라고하자 : 교육 수준이 "기술"의 영향을받는다고 가정 할 수 있습니다. 숙련 된 사람 일수록 교육을받는 것이 더 쉽습니다. 따라서 소득에 대해 교육 기간을 회귀하는 경우 교육 효과 추정기는 "기술"의 영향을 흡수하고 교육에 대한 지나치게 낙관적 인 추정치를 얻습니다. 즉, 교육이 소득에 외생 적이 지 않기 때문에 교육에 대한 교육의 효과는 (위로) 편향되어있다.

Cov(X,ϵ)=0


1
예제와 설명에 감사드립니다. 나는 아직도 내 생성과 외 생성이 평범한 영어로 무엇을 의미하는지에 대해 약간의 실마리가 있습니다. 변수가 내생 적이거나 외인성이라는 말을 할 때 정확히 무엇을 의미합니까?
user25901

@ JohnRos 당신은 "내인성 (endogeneity)은 인과 적 영향을 회복하고자한다면 문제 일 뿐이다"라고 썼다. 그것이 옳다면, 많은 교과서, 때로는 암시 적으로 인과 적 추론이 정상적인 목표라고 가정합니다.
markowitz

@markowitz : 회귀 계수를 추론 할 때마다 인과 관계를 원한다는 것을 암시합니다. 예측 만 원한다면 예측이 좋은 경우 계수 값은 중요하지 않습니다. 고전 교과서는 예측의 과제가 "기본 과학"이 아니라 오히려 "엔지니어링"(그리고이 원유 일반화를 위해 나를 용서하기)이기 때문에 이러한 구별을하지 않는 것이 사실입니다
JohnRos

감사합니다 JohnRos, 관련 요점에 대해 다른 질문을하겠습니다. 계수의 편향 추정 문제는 인과 관계 회귀 모형에서만 의미가 있지만 예측 목표는 확실하지 않습니다. 맞습니까? 이 점이 분명하지 않기 때문에 이것을 묻습니다.
markowitz

8

User25901은 외생 및 내생이라는 용어가 무엇을 의미하는지에 대한 간단하고 실제적인 설명을 찾고 있습니다. 신비한 예나 수학적 정의로 응답한다고해서 실제로 묻는 질문에 대한 답은 아닙니다.

이 두 용어를 어떻게 이해해야합니까?

내가 생각해 낸 것은 다음과 같습니다.

엑소-외부, 외부 Endo-내부, 내부-내부-기원

외인성 : 변수는 모델의 다른 매개 변수 및 변수에 의해 결정되지 않지만 외부에서 설정되고 변경 사항이 외부 힘에서 비롯된 경우 모델에 대해 외인성입니다.

내인성 : 변수가 모델의 다른 매개 변수 및 변수의 기능을 적어도 부분적으로 수행하는 경우 모델에서 내인성입니다.


7
이것들은 합리적인 직관적 정의이지만 다른 답변을 무시할 필요는 없습니다.
gung-복직 모니카

3
어원에 호소하면 기술 용어의 의미 를 기억 하는 데 유용한 핸들 하나를 제공 할 수 있지만 어원을 사용하여이를 정당화 하는 것은 피해야합니다. (통계 및 다른 곳에서) 상당히 많은 용어는 수학적 정의에 대한 신중한 연구를 통해서만 올바르게 이해됩니다. 이 답변을 이해하려면 "결정된", "외부 설정", "변경하다", ​​"외부 힘"및 "부분적으로 [a] 기능"과 같은 단어와 구의 의도 된 사용에 대한 명확한 개념이 필요합니다. 명백하거나 모호하지 않은.
whuber

6

Xϵ=0Xϵ^=0

Y=α+βX+γZ+noiseZXXnoise0ZXlog(ex)=x. 수학적 사실 일뿐입니다. 이것은 생략 된 가변 바이어스입니다.

IYXIXXY

그것은 2 단 최소 제곱으로, IV와 거의 같습니다.


내가 이해하는 것처럼 2SLS가 IV를하는 한 가지 방법이 아니라고 잘못 생각하면 사과드립니다.
user25901

2SLS 표준 오류가 잘못되었습니다. 왜 또는 어떻게 잊어 버렸지 만 구글 "IV 2SLS 표준 오류"를 발견하면 아마도 무언가를 찾을 것입니다. 대부분의 소프트웨어 패키지는 solve (t (z) % * % (x) % * % t (z) % * % y 메소드를 사용하여 2sls를 구현합니다.
generic_user

1
X^X

감사. 나는 이것을 쓸 때 적용된 계량 경제학에서 신선했습니다.
generic_user

-1

회귀 분석에서 우리는 식별 된 종속 변수에 대한 독립 변수 (외생 적이며 다른 것에 의존하지 않는 것으로 가정)의 정량적 영향을 포착하려고합니다. 외인 변수가 종속 변수에 미치는 순 효과가 무엇인지 알고 싶습니다. 즉, 독립 변수는 다른 변수의 영향을받지 않아야합니다. 회귀가 내인성 문제로 고통 받고 있는지 확인하는 빠른 방법은 독립 변수와 잔차 간의 상관 관계를 확인하는 것입니다. 그러나 이것은 대략적인 점검입니다. 그렇지 않으면 내인성에 대한 공식적인 테스트를 수행해야합니다.


3
사실이 아닙니다. 회귀 분석에서 잔차와 설명 변수 간의 상관 관계는 구성에 따라 0입니다. 이것은 내 생성에 대한 테스트가 아닙니다.
Andy

E[ϵX]=0ϵy=b0+b1x+ϵϵE[e^i|x]=0e^iE[e^i|x]=0b^0+b^1x
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.