답변:
나는 몇 가지 속성을 나열하고 나중에 그 가치에 대한 나의 평가를 줄 것이다.
따라서 필요한 것에 따라 표본의 크기가 크고 해석 측면이 더 중요한 경우 CHAID를 사용하는 것이 좋습니다. 또한 멀티 웨이 분할 또는 더 작은 트리가 필요한 경우 CHAID가 더 좋습니다. 반면에 CART는 잘 작동하는 예측 기계이므로 예측이 목표라면 CART로 이동합니다.
모든 단일 트리 방법에는 엄청난 수의 다중 비교가 포함되어 결과에 큰 불안정성을 초래합니다. 그렇기 때문에 어떤 형태의 나무 평균화 (포장, 부스팅, 임의의 숲)가 필요합니다 (나무의 이점을 잃는다는 점을 제외하고는 해석 성). 단일 트리의 단순성은 대체로 환상입니다. 데이터의 여러 하위 집합에 대해 트리를 학습하면 트리 구조간에 큰 불일치가 발생한다는 점에서 잘못 되었기 때문에 단순합니다.
나는 최근의 CHAID 방법론을 보지 않았지만 원래 화신의 CHAID는 데이터를 과도하게 해석하는 데 큰 운동이었습니다.