선형 회귀 분석에 범주 형 변수가있는 경우 범주 형 변수의 통계적 유의성을 어떻게 알 수 있습니까?
요인 에 10 수준이 있다고 가정 해 봅시다. 한 요인 변수 X 1 의 우산 아래에 10 개의 다른 결과 t- 값이있을 것입니다 ...
통계적 유의성이 요인 변수의 각 수준에 대해 테스트 된 것 같습니다. 아니?
@ 매크로 : 당신의 제안에 따라 다음 예제를 작성했습니다.
x3은 유용하고 아래 모델 비교에서 모델에 포함되어야합니다.
그러나 실제로는 잘못되었습니다 ...
n=100
x1=1:n
x2=(1:n)^2
x3=rnorm(n)
ee=rnorm(n)
y=3*x1-2*x2+x3+3+ee
lm1=lm(y~x1+x2+x3)
summary(lm1)
lm2=lm(y~x1+x2)
summary(lm2)
anova(lm1, lm2)
> anova(lm1, lm2)
Analysis of Variance Table
Model 1: y ~ x1 + x2 + x3
Model 2: y ~ x1 + x2
Res.Df RSS Df Sum of Sq F Pr(>F)
1 96 82.782
2 97 146.773 -1 -63.99 74.207 1.401e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
x3
를 생성하는 데 사용 된 것으로 보이y
므로 모델에 포함되어야하며 값이 해당 결론과 일치합니다.