분류 규칙 생성을위한 알고리즘


11

따라서 분류 자에 의해 해결 된 기존의 문제 영역에 상당히 잘 맞는 머신 러닝 응용 프로그램의 가능성이 있습니다. 즉, 항목과 항목을 설명하는 속성 집합이 있습니다. 그러나 모델을 만드는 대신 Naive Bayes 또는 유사한 분류기에서와 같이 확률이 높으면 최종 사용자가 검토하고 수정할 수있는 대략적인 사람이 읽을 수있는 규칙 집합이되기를 원합니다.

연관 규칙 학습은 이러한 유형의 문제를 해결하는 알고리즘 계열처럼 보이지만 이러한 알고리즘은 일반적인 기능 조합을 식별하는 데 중점을두고 있으며 해당 기능이 가리키는 최종 버킷 개념을 포함하지 않습니다. 예를 들어 데이터 세트는 다음과 같습니다.

Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big,   steel } => { truck }
Item C { 2-door, small, steel } => { coupe }

나는 "4 문이라면 작지만"이라고 말하는 규칙이 아니라 "크고 2 문이면 트럭이다"라는 규칙을 원합니다.

내가 생각할 수있는 한 가지 해결 방법은 단순히 연관 규칙 학습 알고리즘을 사용하고 엔드 버킷과 관련이 없지만 약간 해키처럼 보이는 규칙을 무시하는 것입니다. 거기에 알고리즘 계열을 놓친 적이 있습니까? 아니면 처음에 문제에 잘못 접근하고 있습니까?

답변:


9

Quinlan에서 만든 C45는 예측 규칙을 생성 할 수 있습니다. 이 위키 백과 페이지를 확인 하십시오. Weka 에서 이름은 J48이라는 것을 알고 있습니다. R 또는 Python에서 어떤 구현인지 알 수 없습니다. 어쨌든 이런 종류의 의사 결정 트리에서 예측 규칙을 유추 할 수 있어야합니다.

나중에 편집

또한 분류 규칙을 직접 추론하는 알고리즘에 관심이있을 수 있습니다. RIPPER는 Weka에서 또 다른 이름 인 JRip을 받았습니다. RIPPER : Fast Effective Rule Induction, WW Cohen 1995 의 원본 문서를 참조하십시오.


이전 프로젝트에서 C45 / J48을 실험했습니다. 나는 그것을 검색 할 수있는 규칙이 있다는 것을 몰랐다. RIPPER도 확인하겠습니다. 감사!
super_seabass

R의 C50 패키지도 확인하십시오.
nfmcclure

이 질문 / 답변에 대한 업데이트를 제공하고자했습니다. 우리는 약간의 성공으로 JRip을 사용하고 있지만 새로운 주요 경쟁자는 FURIA입니다 ( cs.uni-paderborn.de/fileadmin/Informatik/eim-i-is/PDFs/… ). 철저한 규칙 세트를 생성하려고하기 때문에 인간 검토 / 사용에 가장 적합한 규칙을 생성합니다. JRip은 훌륭한 규칙을 만들지 만 다른 규칙이 적용되지 않으면 분류에 대한 "기본"규칙이 있습니다. 기본 버킷은 프로젝트의 비즈니스 컨텍스트에서 제대로 작동하지 않으므로 철저한 규칙이 필요합니다.
super_seabass

7

실제로 설명하는 것보다 훨씬 간단합니다. 기본 분류 트리 알고리즘 만 찾으면됩니다 (따라서 예측 정확도에 최적화 된 C4.5와 같이 약간 더 복잡한 변형이 필요하지 않습니다). 표준 텍스트는 다음과 같습니다.

http://www.amazon.com/Classification-Regression-Wadsworth-Statistics-Probability/dp/0412048418

이것은 R에서 쉽게 구현됩니다.

http://cran.r-project.org/web/packages/tree/tree.pdf

그리고 파이썬 :

http://scikit-learn.org/stable/modules/tree.html


나는 나무가 여기서 도움이된다는 것에 동의하지 않는다. 이는 규칙을 필터링하는 문제이며 R 의 arules 패키지를 사용하여 달성 할 수 있습니다 .
adesantos


1

R에서 arules 패키지를 시도해야 합니다. 연결 규칙을 만들 수있을뿐만 아니라 각 규칙의 길이, 각 규칙의 중요성을 지정하고 원하는 규칙을 필터링 할 수도 있습니다. 이 패키지의 rhs () 명령).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.