누구든지 scikit에서 RandomForestClassifier와 ExtraTreesClassifier의 차이점을 설명 할 수 있습니까? 나는 논문을 읽는 데 상당한 시간을 보냈다.
P. Geurts, D. Ernst. 및 L. Wehenkel, "매우 무작위 트리", 기계 학습, 63 (1), 3-42, 2006
ET의 차이점은 다음과 같습니다.
1) 분할에서 변수를 선택할 때 훈련 세트의 부트 스트랩 샘플 대신 전체 훈련 세트에서 샘플을 추출합니다.
2) 분할은 각 분할에서 샘플의 값 범위에서 완전히 무작위로 선택됩니다.
이 두 가지의 결과는 더 많은 "잎"입니다.