답변:
나무 의 수가 많을수록 좋습니다. 이 매개 변수를 사용하면 거의 오버 슈트 할 수 없지만 물론 상한은 RF에 소비하려는 계산 시간에 따라 다릅니다.
좋은 방법은 긴 포리스트를 먼저 만든 다음 OOB 정확도가 수렴 될 때 (MATLAB 구현에서 사용할 수 있기를 바랍니다) 확인하는 것입니다.
시도한 속성 의 수 기본값은 전체 속성 수의 제곱근이지만 일반적으로 포리스트는이 매개 변수의 값에 매우 민감하지 않습니다. 실제로 RF의 확률 적 측면이 더 큰 변형을 유발할 수 있기 때문에 거의 최적화되지 않습니다.
나무 의 수가 클수록 클수록 좋습니다.
시도한 속성의 수 는 다릅니다. 정보가 기능에 확산되거나 확산되지 않는 방식에 대한 사전 지식이 이미있는 경우 많은 기능이 정보를 공유하면 해당 매개 변수의 값이 작을수록 더 나은 결과를 얻을 수 있습니다. 반면에 소수의 기능 만 정보를 전달하는 경우 더 큰 값을 사용해야합니다. 다시 말해, 관련 변수가 많을수록 : 더 작은 값이 더 좋고 관련이없는 변수가 더 많을수록 : 더 큰 값이 더 좋습니다.