기본 설정 :
회귀 모델 : 여기서 C는 제어 변수의 벡터입니다.
관심이 있으며 및 가 음수 일 것으로 예상 합니다. 그러나 모델에 다중 공선 성 문제가 있으며 상관 계수는 corr ( , 0.9345, corr ( , 0.1765, corr ( , 0.3019로 지정됩니다.
따라서 과 는 서로 밀접한 관련이 있으며 사실상 동일한 정보를 제공해야합니다. 세 가지 회귀 분석을 실행합니다.
- 변수를 제외 하십시오. 2. 변수를 제외 하십시오. 3. 과 가 모두있는 원본 모델 .
결과 :
회귀 1 및 2의 경우 각각 및 대해 예상되는 부호를 크기는 비슷합니다. 그리고 와 내가 표준 오류가있는 HAC 보정을 한 후 두 모델의 10 % 수준에서 중요하다. 은 양이지만 두 모델에서 모두 유의하지는 않습니다.
그러나 3의 경우 에 예상 부호가 있지만 대한 부호 는 절대 값에서 보다 두 배 큰 양수입니다 . 그리고 모두 와 미미하다. 또한 의 크기는 회귀 1 및 2에 비해 거의 절반으로 줄어 듭니다.
내 질문은 :
3에서 왜 의 부호 가 양수이고 절대 값에서 보다 훨씬 커 ? 가 부호를 수 있고 크기가 큰 통계적 이유가 있습니까? 아니면 팽창 모델 1과 2를 생략 고통을 가변하기 때문에 문제이다 제공 Y에 긍정적 인 효과를? 그러나 회귀 모델 1과 2에서는 회귀 모델 3에서 과 의 총 효과가 긍정적 와 은 모두 음이 아니라 양수 여야합니다 .