답변:
내가 Tan 등의 데이터 마이닝 소개에서 찾은 것처럼. 알 :
연구에 따르면 불순물 측정의 선택은 의사 결정 트리 유도 알고리즘의 성능에 거의 영향을 미치지 않습니다. 이것은 많은 불순물 측정이 서로 상당히 일관성이 있기 때문입니다 [...]. 실제로, 나무를 가지 치기 위해 사용 된 전략은 불순물 측정의 선택보다 최종 나무에 더 큰 영향을 미칩니다.
따라서 CART와 같은 Gini 인덱스 또는 C4.5와 같은 Entropy를 사용하도록 선택할 수 있습니다.
엔트로피,보다 구체적으로 C4.5의 게인 비율을 사용합니다. Quinlan의 잘 작성된 책 : 기계 학습을위한 C4.5 프로그램을 쉽게 따라갈 수 있기 때문입니다.