패키지 vif()
방법 을 사용하여 car
모델에서 입력의 다중 공선도를 계산할 수 있다는 것을 배웠습니다 . 에서 위키 피 디아 경우, vif
값이보다 큰 경우 5
우리는 입력이 다중 공선 성 문제를 앓고 있음을 고려할 수 있습니다. 예를 들어, lm()
방법을 사용하여 선형 회귀 모델을 개발 vif()
했으며 다음과 같이 제공합니다. 우리가 볼 수 있듯이, 입력 ub
, lb
및 tb
다중 공선 고통 받고있다.
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
다중 공선 성 문제를 피하고 모델을보다 강력하게 만들기 위해 ub
와 사이의 상호 작용을 취 lb
했으며 이제 새 모델의 vif 테이블은 다음과 같습니다.
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
R^2
위의 두 경우 모두 에서 값의 차이는 크지 않으며 일회성 CV 테스트의 오류에는 큰 차이가 없습니다.
내 질문은 :
위와 같이 상호 작용을 취함으로써 다중 공선 성 문제를 피하는 것이 좋습니까?
위의 vif 방법 결과와 비교하여 다중 공선 성 문제를 제시하는 더 좋은 방법이 있습니까?
나에게 당신의 제안을 제공하십시오.
감사.