임의 포리스트 (R의 randomForest 패키지 사용)를 기반으로 예측 분류 모델이 있다고 가정합니다. 최종 사용자가 예측을 생성 할 항목을 지정할 수 있도록 설정하고 분류 가능성을 출력하려고합니다. 지금까지 아무런 문제가 없습니다.
그러나 변수 중요도 그래프와 같은 것을 출력 할 수 있지만 훈련 세트가 아닌 특정 항목에 대해 예측할 수 있으면 유용하고 멋집니다. 다음과 같은 것 :
항목 X는 개일 것으로 예상됩니다 (73 % 가능성)
:
다리 = 4
호흡 = 나쁜
털 = 짧은
음식 = 불쾌한
당신은 요점을 얻습니다. 훈련 된 임의의 포리스트에서이 정보를 추출하는 표준 또는 적어도 정당화 가능한 방법이 있습니까? 그렇다면 randomForest 패키지 에서이 작업을 수행하는 코드가 있습니까?
m
예측 변수를 하나씩 변경 하고 포리스트가 어떻게 다르게 예측하는지 살펴 보는 것은 다소 비싸 보입니다. 더 좋은 방법이 있습니다.