면책 조항 : 이것은 숙제 프로젝트입니다.
나는 여러 변수에 따라 다이아몬드 가격에 가장 적합한 모델을 만들려고 노력하고 있으며 지금까지 꽤 좋은 모델을 가지고있는 것 같습니다. 그러나 분명히 공선 인 두 가지 변수가 있습니다.
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
테이블과 깊이는 서로 의존적이지만 여전히 예측 모델에 포함하고 싶습니다. 다이아몬드에 대한 연구를 한 결과, 테이블과 깊이는 상단의 길이와 상단에서 하단까지의 거리라는 것을 알았습니다. 다이아몬드의이 가격은 아름다움과 아름다움에 관련된 것으로 보인다 때문에 내가 그들의 비율을 포함 거라고, 관련 비율을 것 같다,라고 가격을 예측하기. 공선 변수를 처리하기위한이 표준 절차입니까? 그렇지 않다면 무엇입니까?
편집 : 다음은 깊이 ~ 표의 플롯입니다.