답변:
이것은 주로 기술적 인 문제입니다. 바이너리 선택으로 제한하지 않으면 트리의 다음 분할에 대한 가능성이 너무 많습니다. 따라서 귀하는 귀하의 질문에 대한 모든 요점에서 분명히 옳습니다.
대부분의 트리 유형 알고리즘은 단계적으로 작동하며 최상의 결과를 보장하지는 않습니다. 이것은 하나의 추가주의 사항입니다.
대부분의 실제 목적을 위해, 나무를 건축 / 정리 하는 동안 은 아니지만 , 두 종류의 분할은 서로 바로 후에 나타난다는 점에서 동일합니다.
어린이 중 하나에 대한 양방향 분할과 다른 양방향 분할은 단일 3 방향 분할과 동일하지 않습니다.
무슨 말인지 잘 모르겠습니다. 모든 다중 분할은 일련의 양방향 분할로 표시 될 수 있습니다. 3 방향 분할의 경우 먼저 A & B 대 C로 분할 한 다음 A를 B에서 분할하여 A, B 및 C로 분할 할 수 있습니다.
주어진 알고리즘은 특정 시퀀스 (특히 대부분의 알고리즘과 마찬가지로 탐욕스러운 경우)를 선택하지 않을 수 있지만 확실히 가능합니다. 그리고 임의의 숲이나 부스트 트리에서와 같이 임의의 무작위 또는 단계적 절차가 수행되면 올바른 분할 순서를 찾을 가능성이 높아집니다. 다른 사람들이 지적했듯이, 다 방향 분할은 계산 비용이 많이 들기 때문에 이러한 대안을 고려할 때 대부분의 연구자들은 이진 분할을 선택한 것으로 보입니다.
이것이 도움이되기를 바랍니다.
의사 결정 트리 및 분할 (이진 대 다른 방법)의 사용과 관련하여 비 이진 분할이있는 CHAID 만 알고 있지만 다른 것도 있습니다. 나를 위해 비 이진 분할의 주된 용도는 여러 수준의 명목 변수를 최적으로 비닝하는 방법을 찾고있는 데이터 마이닝 연습입니다. 일련의 이진 분할은 CHAID가 수행하는 그룹화만큼 유용하지 않습니다.