개요
예측 변수가 서로 연관되어 있으면 2 차 항과 교호 작용 항에 비슷한 정보가 포함됩니다. 이는 2 차 모형 또는 교호 작용 모형을 유의하게 만들 수 있습니다. 그러나 두 용어가 모두 포함 된 경우, 두 용어가 모두 유사하기 때문에 의미가 없습니다. VIF와 같은 다중 공선성에 대한 표준 진단은이를 감지하지 못할 수 있습니다. 상호 작용 대신 2 차 모델을 사용하는 효과를 감지하도록 특별히 설계된 진단 플롯조차도 어떤 모델이 가장 적합한 지 결정하지 못할 수 있습니다.
분석
이 분석의 추진력과 그 주된 강점은 질문에 설명 된 것과 같은 상황을 특성화하는 것입니다. 그러한 특성화가 가능하면 그에 따라 동작하는 데이터를 시뮬레이션하는 것이 쉬운 작업입니다.
두 개의 예측 변수 및 X 2 (각각 데이터 집합에서 단위 분산을 갖도록 자동으로 표준화 할 것임)를 고려하고 무작위 응답 Y 는 이러한 예측 변수와 해당 상호 작용 및 독립적 인 임의 오류에 의해 결정 된다고 가정합니다 .X1X2Y
Y=β1X1+β2X2+β1,2X1X2+ε.
많은 경우 예측 변수는 서로 관련되어 있습니다. 데이터 세트는 다음과 같습니다.
이들 샘플 데이터는 및 β 1 , 2 = 0.1로 생성되었다 . X 1 과 X 2 사이의 상관 관계 는 0.85 입니다.β1=β2=1β1,2=0.1X1X20.85
그렇다고해서 반드시 과 X 2 를 랜덤 변수의 실현으로 생각하고있는 것은 아닙니다 . X 1 과 X 2 가 설계된 실험에서 설정 되는 상황을 포함 할 수 있지만 어떤 이유로 이러한 설정이 직교하지는 않습니다.X1X2X1X2
상관 관계가 어떻게 발생하는지에 관계없이이를 설명하는 좋은 방법은 예측 변수가 평균과 얼마나 다른지에 관한 것입니다 . 이 차이는 상당히 작습니다 (그들의 분산이 1 보다 작다는 의미에서 ). X 1 과 X 2 사이의 상관 관계가 클수록 이러한 차이는 더 작아집니다. 그런 다음 X 1 = X 0 + δ 1 및 X 2 = X 0 + δ 쓰기X0=(X1+X2)/21X1X2X1=X0+δ1 , 우리는 (말) 다시 표현할 수 X 2 의 측면에서 X 1 로 X 2 = X 1 + ( δ 2 - δ 1 ) . 이 점을 연결해상호 작용만을 용어 모델이다X2=X0+δ2X2X1X2=X1+(δ2−δ1)
Y=β1X1+β2X2+β1,2X1(X1+[δ2−δ1])+ε=(β1+β1,2[δ2−δ1])X1+β2X2+β1,2X21+ε
값 제공자 만 약간 비교 비트 변화 β 1 , 우리는 실제 임의의 조항이 변형을 수집 할 서면β1,2[δ2−δ1]β1
Y=β1X1+β2X2+β1,2X21+(ε+β1,2[δ2−δ1]X1)
따라서 우리가 Y 를 회귀하면와이 및 X 2 1 에 대해 를 하면 오류가 발생합니다. 잔차의 변동은 X 1에 따라 달라집니다 (즉, 이분산성입니다 ). 이것은 간단한 분산 계산으로 볼 수 있습니다.엑스1, X2엑스21엑스1
var ( ε + β1 , 2[ δ2− δ1] X1) =var(ε)+ [ β21 , 2var ( δ2− δ1) ] X21.
그러나 의 전형적인 변동이 β 1 의 전형적인 변동을 실질적으로 초과하면ε, 이분산성은 검출 될 수 없을 정도로 낮아질 것이며 (미세 모델을 산출해야한다). (아래 나타낸 바와 같이, 회귀 가정이 위배를 찾는 방법은 하나의 절대 값에 대한 잔차의 절대 값을 플롯하는 X 1 표준화 제 --remembering을 X 1 필요한 경우). 이것은 우리가 추구했던 특성 인 .β1,2[δ2−δ1]X1X1X1
기억 및 X 2 단위 분산 표준화 것으로 가정하고,이의 분산을 의미한다 δ 2 - δ 1 상대적으로 적은 것입니다. 관찰 된 동작을 재현하려면 β 1 , 2에 대해 작은 절대 값을 선택하는것만으로 충분하지만 , 값이충분히 커지도록 (또는 충분히 큰 데이터 세트를 사용하여) 유의해야합니다.X1X2δ2−δ1β1,2
요컨대, 예측 변수가 서로 연관되어 있고 상호 작용이 작지만 너무 작지 않은 경우 2 차 항 (예측 자만 해당)과 상호 작용 항은 개별적으로 유의하지만 서로 혼동됩니다. 통계적 방법만으로는 어느 것이 더 나은지를 결정하는 데 도움이되지 않을 것입니다.
예
β1,20.1150
먼저, 이차 모형 :
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.03363 0.03046 1.104 0.27130
x1 0.92188 0.04081 22.592 < 2e-16 ***
x2 1.05208 0.04085 25.756 < 2e-16 ***
I(x1^2) 0.06776 0.02157 3.141 0.00204 **
Residual standard error: 0.2651 on 146 degrees of freedom
Multiple R-squared: 0.9812, Adjusted R-squared: 0.9808
0.068β1,2=0.1
x1 x2 I(x1^2)
3.531167 3.538512 1.009199
5
다음으로 교호 작용은 있지만 2 차항은없는 모형 :
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.02887 0.02975 0.97 0.333420
x1 0.93157 0.04036 23.08 < 2e-16 ***
x2 1.04580 0.04039 25.89 < 2e-16 ***
x1:x2 0.08581 0.02451 3.50 0.000617 ***
Residual standard error: 0.2631 on 146 degrees of freedom
Multiple R-squared: 0.9815, Adjusted R-squared: 0.9811
x1 x2 x1:x2
3.506569 3.512599 1.004566
모든 결과는 이전 결과와 유사합니다. 둘 다 거의 동일합니다 (상호 작용 모델에 매우 작은 이점이 있음).
마지막으로 교호 작용과 2 차항을 모두 포함시켜 봅시다 .
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.02572 0.03074 0.837 0.404
x1 0.92911 0.04088 22.729 <2e-16 ***
x2 1.04771 0.04075 25.710 <2e-16 ***
I(x1^2) 0.01677 0.03926 0.427 0.670
x1:x2 0.06973 0.04495 1.551 0.123
Residual standard error: 0.2638 on 145 degrees of freedom
Multiple R-squared: 0.9815, Adjusted R-squared: 0.981
x1 x2 I(x1^2) x1:x2
3.577700 3.555465 3.374533 3.359040
X1X2X21X1X2
우리가 2 차 모형 (첫 번째 모형)에서 이분산성을 탐지하려고한다면 실망 할 것입니다.
|X1|