임의 포리스트 (R의 randomForest 패키지 사용)를 기반으로 예측 분류 모델이 있다고 가정합니다. 최종 사용자가 예측을 생성 할 항목을 지정할 수 있도록 설정하고 분류 가능성을 출력하려고합니다. 지금까지 아무런 문제가 없습니다.
그러나 변수 중요도 그래프와 같은 것을 출력 할 수 있지만 훈련 세트가 아닌 특정 항목에 대해 예측할 수 있으면 유용하고 멋집니다. 다음과 같은 것 :
항목 X는 개일 것으로 예상됩니다 (73 % 가능성)
:
다리 = 4
호흡 = 나쁜
털 = 짧은
음식 = 불쾌한
당신은 요점을 얻습니다. 훈련 된 임의의 포리스트에서이 정보를 추출하는 표준 또는 적어도 정당화 가능한 방법이 있습니까? 그렇다면 randomForest 패키지 에서이 작업을 수행하는 코드가 있습니까?
m예측 변수를 하나씩 변경 하고 포리스트가 어떻게 다르게 예측하는지 살펴 보는 것은 다소 비싸 보입니다. 더 좋은 방법이 있습니다.