답변:
위키 백과 문서는 특히 인상적이 아니다. 이 슬라이드가 더 도움이 될 것입니다 : 1 , 2 , 3 .
각 수준에서 당신은 빈번한 -item 세트 (지원이 충분 함).
다음 단계에서 +-item 세트는 각 서브 세트가 자주 있어야한다는 특성을 가져야합니다 (지원이 충분 함). 이것은 apriori 속성입니다 . 빈번한 항목 집합의 모든 하위 집합은 빈번해야합니다.
레벨 2에서 , , 과 충분한 지원을 제공하는 유일한 세트입니다. 그런 다음 레벨 3에서 서로 연결하여 , , 과 하지만 당신은 단지 고려해야합니다 또한 다른 것들은 각각 지원이 부족한 부분 집합 (예 : 또는 ).
Apriori 알고리즘은 데이터 마이닝에 사용되는 연결 규칙 마이닝 알고리즘입니다. 주어진 트랜잭션 수 중에서 빈번한 항목 세트를 찾는 데 사용됩니다.
기본적으로 두 단계로 구성됩니다
이 단계를 k 번 반복합니다. 여기서 k는 항목 수입니다. 마지막 반복에서 k 개의 항목을 포함하는 빈번한 항목 세트를 얻습니다.
자세한 예제 http://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.html 과 함께 간단한 설명을 보려면 여기를 참조 하십시오 .
복잡한 방정식없이 간단한 설명이 있습니다.
평범한 영어로 된 Apriori.
Apriori는 k- itemsets가 (k + 1) -itemets 를 탐색하는 데 사용되는 레벨 별 검색으로 알려진 반복적 인 접근 방식 을 사용합니다 . 먼저, 데이터베이스를 스캔하여 각 항목의 수를 누적하고 최소 지원을 만족시키는 항목을 수집하여 빈번한 1- 항목 세트를 찾습니다 . 결과 집합은 L1 으로 표시됩니다 . 다음으로, L1은 더 자주 k-itemsets 를 찾을 수 없을 때까지 L3을 찾는 데 사용되는 자주 사용되는 2 개 항목 세트 인 L2 를 찾는 데 사용 됩니다. 각 Lk를 찾으려면 데이터베이스를 한 번 전체 스캔해야합니다.
마지막 반복에서는 기본적으로 연관 규칙 이라고하는 많은 k- 항목 이 생깁니다 . 가능한 모든 규칙 세트에서 흥미로운 규칙을 선택하기 위해 지원 및 신뢰 와 같은 다양한 제한 조치 가 적용됩니다.
용어 및 용어
결합 단계 : 1 개의 항목 세트가 자체적으로 결합되어 2 개의 항목 세트를 생성한다는 의미입니다.
제거 단계 : 여기서 결합 결과 세트는 최소 지원 임계 값으로 필터링됩니다.
카디널리티 세트 : 프룬 단계의 결과 세트.
지원 = 'a'와 'b'를 포함하는 수사 건수 / 총 거래 건수 없음.
지원 => supp (a, b) => p (a U b)
자신감 = 'a'및 'b'를 포함하는 거래 수 / 'a'를 포함하는 거래 없음
자신감 => con (a, b) ==> P (b | a) 조건부 확률.