변수 와 X 2 는 선형 적으로 독립적이지 않습니다. 그래서 경우에도 추가, 어떤 차 효과가없는 X 2 의 예상 효과를 수정합니다 모델에 X를 .XX2X2X
매우 간단한 시뮬레이션으로 살펴 봅시다.
> x <- runif(1e3)
> y <- x + rnorm(length(x))
> summary(lm(y~x))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.03486 0.06233 -0.559 0.576
x 1.05843 0.10755 9.841 <2e-16 ***
이제 모형에 2 차 항이 적합합니다.
> summary(lm(y~x+I(x^2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.03275 0.09528 0.344 0.731
x 0.65742 0.44068 1.492 0.136
I(x^2) 0.39914 0.42537 0.938 0.348
물론 옴니버스 테스트는 여전히 중요하지만, 우리가보고있는 결과는 이것이 아니라고 생각합니다. 해결책은 직교 다항식을 사용하는 것입니다.
> summary(lm(y~poly(x,2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.49744 0.03098 16.059 <2e-16 ***
poly(x, 2)1 9.63943 0.97954 9.841 <2e-16 ***
poly(x, 2)2 0.91916 0.97954 0.938 0.348
x
첫 번째 모델과 poly(x,2)1
두 번째 모델 의 계수는 같지 않으며 인터셉트도 다릅니다. 이는 poly
직교 법선 벡터를 제공 하기 때문에 벡터와 직교합니다 rep(1, length(x))
. 따라서 그보다 poly(x,2)1
는 x
오히려 (x -mean(x))/sqrt(sum((x-mean(x))**2))
...
중요한 점은이 마지막 모델에서 Wald 테스트가 독립적이라는 것입니다. 직교 다항식을 사용하여 Wald 테스트를보고 원하는 정도까지 결정할 수 있습니다. 여기서 는 유지 하지만 X 2는 유지 하지 않기로 결정합니다 . 물론 처음 두 개의 적합 모델을 비교하여 동일한 모델을 찾을 수 있지만이 방법은 더 간단합니다. 더 높은 각도로 올라가는 것을 고려하면 훨씬 더 간단합니다.XX2
유지할 항을 결정한 후에 는 해석 가능성 또는 예측을 위해 원시 다항식 및 X 2 로 돌아갈 수 있습니다 .XX2