예시를 위해 , 예측 변수 X 2 및 X 3 이 상관 될 수있는 덜 복잡한 회귀 모델 Y=β1+β2X2+β3X3+ϵ 취할 것입니다. 하자 슬로프 말 β (2) 및 β (3)가 모두 긍정적 인 우리가 말할 수 있도록 그 (I) 의 Y 로 증가 X 이 개 증가하면 X 3는 개최 일정은 이후입니다 β 2 개X2X3β2β3YX2X3β2 긍정적이다; (ii) Yβ 3 이 양수 이므로 X 2 가 일정하게 유지 되면 X3 증가 함에 따라 증가한다 .X2β3
다른 변수가 일정하게 유지 될 때 발생하는 상황 ( "세 테리아 파리 부") 을 고려하여 다중 회귀 계수를 해석하는 것이 중요합니다 . 난 그냥 회귀한다고 가정 Y 상대로 X2 모델로 Y=β′1+β′2X2+ϵ′ . 기울기 계수 β′2 대한 나의 추정은 X 3 을 유지 하지 않고 X 2 에서 한 단위 증가의 Y 에 미치는 영향을 측정합니다.X2 X3일정하게 나의 추정치가 나의 추정치 β 와 다를 수β2 회귀들 - 즉,도에 미치는 영향을 측정Y 에 하나 개의 단위 증가X2 하지만않는홀드X3 상수. 내 추정β′2^ 의 문제는 X 2 및 X 인 경우생략 된 변수 바이어스가 발생한다는 것입니다X2X3 이 서로 관련입니다.
이유를 이해하려면 X2 와 X3 이 음의 상관 관계가 있다고 가정하십시오. 이제 X2 를 한 단위 씩 늘리면 β 2 > 0 이후 Y 의 평균값 이 증가해야 한다는 것을 알고 있습니다. 그러나 X 2가 증가함에 따라 X 3을 일정하게 유지하지 않으면 X 3 이 감소하는 경향이 있으며 β 3 > 0 이기 때문에 Y 의 평균값이 감소하는 경향이 있습니다 . 따라서 X 2 3 의 한 단위 증가의 전체적인 효과 또한 변하기 때문에 ββ2>0X2X3X3β3>0YX2 내가 허용하는 경우 낮은 나타납니다 X3β′2<β2. 상황이 악화 더 강하게 얻을X2및X3상관 관계, 그리고 효과가 큰X3을 통해β3- 정말 심각한 경우에 우리는 심지어 찾을 수 있습니다β′2<0우리가 알고에도 불구하고, paribus을 다른 조건,X2에 긍정적 인 영향을 미칩니다Y!
이제 X 2 에 대해 Y 의 그래프를 그리는 것이 모델에서 Y 와 X 2 의 관계를 시각화하는 데 좋지 않은 이유를 알 수 있기를 바랍니다 . 내 예에서, 당신의 눈은 회귀 모델 의 ^ β 2 를 반영하지 않는 기울기 ^ β ′ 2 에 가장 잘 맞는 선으로 그려 질 것 입니다. 최악의 경우, 모형은 X 2가 증가 함에 따라 Y가 증가 한다고 예측할 수 있지만 (다른 변수는 일정하게 유지됨) 그래프의 점은 Y 가 X에 따라 감소 함을 나타냅니다.X2YX2β′2^β2^YX2YX2 증가나타냅니다.
문제는 X 2 에 대한 Y 의 간단한 그래프 에서 다른 변수는 일정하게 유지되지 않는다는 것입니다. 이것은 추가 변수 그림 (부분 회귀 그림이라고도 함)의 이점에 대한 중요한 통찰력입니다. Frisch-Waugh-Lovell 정리를 사용하여 다른 예측 변수의 효과를 "부분적으로 계산"합니다. 그림의 수평선 및 수직 축은 아마도 " 다른 예측 변수가 계산 된 후 X 2 "및 " 다른 예측 변수가 계산 된 후 Y " 로 가장 쉽게 이해 될 수 있습니다 * . 이제 Y 와 X 의 관계를 볼 수 있습니다X2X2YYX2 다른 모든 예측 변수가 설명되면 2. 예를 들어, 각 그림에서 볼 수있는 기울기는 이제 원래 다중 회귀 모델의 부분 회귀 계수를 반영합니다.
추가 된 변수 그림의 잔차가 원래 다중 회귀 분석의 잔차이므로, 추가 된 변수 그림의 많은 값이 회귀 진단 단계에서 발생합니다. 이는 다중 회귀 모델이 아닌 단순 회귀 모형을 볼 때와 유사한 방식으로 특이 치와 이분산성을 식별 할 수 있음을 의미합니다. 영향력있는 지점도 볼 수 있습니다. 다른 변수를 고려하기 전에 원본 데이터에서 일부 영향력있는 지점이 명확하지 않기 때문에 다중 회귀 분석에 유용합니다. 내 예에서, 적당히 큰 X2 값은 데이터의 테이블에 장소 밖으로 보이지만하지 않을 경우 X3 값에도 불구하고뿐만 아니라 큰 X2 및 X3 이 음의 상관 관계를 갖는 경우, 조합은 드물다. "다른 예측 변수를 고려하면"X2 값이 비정상적으로 커지고 추가 된 변수 그림에서 더 두드러지게 나타납니다.
∗ 보다 기술적으로는 2 개의 다른 다중 회귀 분석을 실행할 때의 잔차가됩니다. X 2 이외의 모든 예측 변수에 대한Y 회귀의 잔차는 세로 축으로 이동하고 회귀 X 2 의 잔차는모든 가로 축으로 이동합니다. 이것이 바로 " Y given others"와 " X 2 given others"의 전설이여러분에게 말하는 것입니다. 이 두 회귀 모두의 평균 잔차가 0이므로 ( X 2의 다른평균, YX2X2YX2X2Y추가 된 변수 그림의 회귀선이 항상 원점을 통과하는 이유를 설명하는 (0, 0)입니다. 그러나 나는 종종 축을 언급하는 것이 다른 회귀의 잔차라는 사실을 사람들에게 혼란스럽게 만듭니다 (아마도 우리가 지금 네 가지 다른 회귀에 대해 이야기하고 있기 때문에 놀랍지 않습니다!). " 다른 사람에게 주어진 X2 "와 " 다른 사람에게 주어진 Y "로 이해하면 괜찮을 것입니다.