이 두 기술의 실제 차이점에 대한 간단한 설명이 있습니까?
둘 다 감독 학습에 사용되는 것으로 보입니다 (연관 규칙은 감독되지 않은 사람도 처리 할 수 있음).
둘 다 예측에 사용될 수 있습니다
내가 '좋은'설명에서 찾은 가장 가까운 것은 Statsoft Textbook에서 입니다. 그들은 협회 규칙 이 다음을 위해 사용 된다고 말합니다 .
... 대용량 데이터 세트에서 범주 형 변수의 특정 값 사이의 관계 또는 연관을 감지합니다.
반면 의사 결정 트리 분류가 사용되는 것으로 설명되어 있습니다 :
... 하나 이상의 예측 변수에 대한 측정치에서 범주 형 종속 변수 클래스의 케이스 또는 객체의 구성원을 예측합니다.
그러나 R 데이터 마이닝에서는 대상 필드와 함께 사용되는 연관 규칙 의 예를 제공 합니다 .
따라서 둘 다 그룹 멤버십을 예측하는 데 사용될 수 있습니다. 의사 결정 트리가 비 분류 입력 데이터를 처리 할 수있는 반면 연관 규칙이 할 수없는 주요 차이점은 무엇입니까? 아니면 더 근본적인 것이 있습니까? 한 사이트 ( sqlserverdatamining.com )에 따르면 주요 차이점은 다음과 같습니다.
의사 결정 트리 규칙은 정보 획득을 기반으로하지만 연결 규칙은 인기 및 / 또는 신뢰를 기반으로합니다.
따라서 (내 자신의 질문에 대답 할 수 있음) 의사 결정 트리가 실제로 분산을 최소화하려고 시도하는 동안 연관 규칙이 데이터 세트에 얼마나 자주 나타나는지 (그리고 얼마나 '참'인지) 순전히 연관 규칙을 평가한다는 것을 의미합니까?
누군가 좋은 설명을 알고 있다면 저를 향해 기꺼이 가리킬 것입니다.