따라서 분류 자에 의해 해결 된 기존의 문제 영역에 상당히 잘 맞는 머신 러닝 응용 프로그램의 가능성이 있습니다. 즉, 항목과 항목을 설명하는 속성 집합이 있습니다. 그러나 모델을 만드는 대신 Naive Bayes 또는 유사한 분류기에서와 같이 확률이 높으면 최종 사용자가 검토하고 수정할 수있는 대략적인 사람이 읽을 수있는 규칙 집합이되기를 원합니다.
연관 규칙 학습은 이러한 유형의 문제를 해결하는 알고리즘 계열처럼 보이지만 이러한 알고리즘은 일반적인 기능 조합을 식별하는 데 중점을두고 있으며 해당 기능이 가리키는 최종 버킷 개념을 포함하지 않습니다. 예를 들어 데이터 세트는 다음과 같습니다.
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
나는 "4 문이라면 작지만"이라고 말하는 규칙이 아니라 "크고 2 문이면 트럭이다"라는 규칙을 원합니다.
내가 생각할 수있는 한 가지 해결 방법은 단순히 연관 규칙 학습 알고리즘을 사용하고 엔드 버킷과 관련이 없지만 약간 해키처럼 보이는 규칙을 무시하는 것입니다. 거기에 알고리즘 계열을 놓친 적이 있습니까? 아니면 처음에 문제에 잘못 접근하고 있습니까?