평범한 영어로 된 Apriori 알고리즘?


9

Apriori에 대한 위키 기사를 읽었습니다. 정리 및 가입 단계를 이해하는 데 문제가 있습니다. 누구든지 Apriori 알고리즘이 간단한 용어로 어떻게 작동하는지 설명 할 수 있습니까 (나 같은 초보자도 쉽게 이해할 수 있도록)?

누군가가 관련된 단계별 프로세스를 설명하면 좋을 것입니다.


내 파이썬 구현에 관심이있을 수 있습니다 .
Martin Thoma

답변:


11

위키 백과 문서는 특히 인상적이 아니다. 이 슬라이드가 더 도움이 될 것입니다 : 1 , 2 , 3 .

각 수준에서 케이당신은 케이빈번한 -item 세트 (지원이 충분 함).

다음 단계에서 케이+1-item 세트는 각 서브 세트가 자주 있어야한다는 특성을 가져야합니다 (지원이 충분 함). 이것은 apriori 속성입니다 . 빈번한 항목 집합의 모든 하위 집합은 빈번해야합니다.

레벨 2에서 {1,2}, {1,}, {1,5}{,5} 충분한 지원을 제공하는 유일한 세트입니다. 그런 다음 레벨 3에서 서로 연결하여 {1,2,}, {1,2,5}, {1,,5}{2,,5} 하지만 당신은 단지 고려해야합니다 {1,,5} 또한 다른 것들은 각각 지원이 부족한 부분 집합 (예 : {2,} 또는 {2,5} ).


2

Apriori 알고리즘은 데이터 마이닝에 사용되는 연결 규칙 마이닝 알고리즘입니다. 주어진 트랜잭션 수 중에서 빈번한 항목 세트를 찾는 데 사용됩니다.

기본적으로 두 단계로 구성됩니다

  1. 자가 가입
  2. 전정

이 단계를 k 번 반복합니다. 여기서 k는 항목 수입니다. 마지막 반복에서 k 개의 항목을 포함하는 빈번한 항목 세트를 얻습니다.

자세한 예제 http://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.html 과 함께 간단한 설명을 보려면 여기를 참조 하십시오 .

복잡한 방정식없이 간단한 설명이 있습니다.


2
더 자세한 설명없이 블로그에 링크하기보다는 강조하고 싶은 주요 요점을 요약하는 것이 더 낫기 때문에이 포스트 통지를 남겼 습니다 . 또한이 사이트의 목적은 매달린 링크 또는 임시 링크에 대한 최소한의 종속성으로 특정 질문에 대한 지식이 풍부한 응답 모음을 구축하는 것입니다. 따라서 위의 링크가 10 년 후에도 계속 작동한다고 보장 할 수 없다면 현재 회신에서 주요 요점을 요약하는 것이 좋습니다.
chl

1

평범한 영어로 된 Apriori.

Apriori는 k- itemsets가 (k + 1) -itemets 를 탐색하는 데 사용되는 레벨 별 검색으로 알려진 반복적 인 접근 방식 을 사용합니다 . 먼저, 데이터베이스를 스캔하여 각 항목의 수를 누적하고 최소 지원을 만족시키는 항목을 수집하여 빈번한 1- 항목 세트를 찾습니다 . 결과 집합은 L1 으로 표시됩니다 . 다음으로, L1은 더 자주 k-itemsets 를 찾을 수 없을 때까지 L3을 찾는 데 사용되는 자주 사용되는 2 개 항목 세트 인 L2 를 찾는 데 사용 됩니다. 각 Lk를 찾으려면 데이터베이스를 한 번 전체 스캔해야합니다.

마지막 반복에서는 기본적으로 연관 규칙 이라고하는 많은 k- 항목생깁니다 . 가능한 모든 규칙 세트에서 흥미로운 규칙을 선택하기 위해 지원신뢰 와 같은 다양한 제한 조치 가 적용됩니다.

용어 및 용어

  • 1- 항목 세트는 {a}, {b}, {c}
  • 2- 항목 세트는 {a, b}, {d, d}, {a, c}를 의미합니다
  • K- 항목 세트는 {i1, i2, i3, ... ik}, {j1, j2, j3, .... jk}를 의미합니다.

결합 단계 : 1 개의 항목 세트가 자체적으로 결합되어 2 개의 항목 세트를 생성한다는 의미입니다.

제거 단계 : 여기서 결합 결과 세트는 최소 지원 임계 값으로 필터링됩니다.

카디널리티 세트 : 프룬 단계의 결과 세트.

지원 = 'a'와 'b'를 포함하는 수사 건수 / 총 거래 건수 없음.

지원 => supp (a, b) => p (a U b)

자신감 = 'a'및 'b'를 포함하는 거래 수 / 'a'를 포함하는 거래 없음

자신감 => con (a, b) ==> P (b | a) 조건부 확률.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.