R의 임의 포리스트 모델을 사용하여 예측하려고합니다.
그러나 테스트 세트의 일부 요소가 훈련 세트와 다른 값을 가지므로 오류가 발생합니다. 예를 들어, 테스트 세트에는 학습 세트에 표시되지 않은 Cat_2
값 34, 68, 76
등 이 있습니다 . 불행히도, 테스트 세트를 제어 할 수 없습니다 ... 나는 그대로 사용해야합니다.
내 유일한 해결 방법은을 사용하여 문제가되는 요인을 숫자 값으로 다시 변환하는 것 as.numeric()
입니다. 그것은 작동 하지만,이 값이 더 숫자 감각이없는 코드이기 때문에 나는 매우 만족하고 있지 않다 ...
테스트 세트에서 새로운 값을 제거하는 또 다른 솔루션이 있다고 생각하십니까? 그러나 1, 2, 14, 32
훈련과 테스트에 있으며 예측에 유용한 정보를 포함 하는 다른 모든 요인 값 (값 등)을 제거하지 않습니다 .