다음과 동등한 데이터가 있습니다.
shopper_1 = ['beer', 'eggs', 'water',...]
shopper_2 = ['diapers', 'beer',...]
...
이 데이터 세트에 대한 분석을 수행하여 다음과 유사한 상관 관계 매트릭스를 얻을 수 있습니다. x를 구입하면 y를 구입할 가능성이 높습니다.
파이썬 (또는 아마도 MATLAB 이외의 것을 사용)을 사용하면 어떻게 할 수 있습니까? 몇 가지 기본 지침 또는 도움이 필요한 위치에 대한 포인터.
감사합니다,
편집-내가 배운 것 :
이러한 종류의 문제를 연관 규칙 발견이라고합니다. Wikipedia에는 일반적인 알고리즘 중 일부를 다루는 좋은 기사 가 있습니다. 그렇게하는 고전적인 알고리즘은 Agrawal et al. 알.
저를 이끌어 즉, 오렌지 , 파이썬 패키지를 마이닝 데이터 인터페이스. Linux의 경우 가장 좋은 설치 방법은 제공된 setup.py를 사용하여 소스에서 온 것 같습니다.
기본적으로 주황색은 여러 가지 지원되는 방법 중 하나로 형식화 된 파일에서 입력을 읽습니다.
마지막으로 간단한 Apriori 연관 규칙 학습은 주황색 으로 간단 합니다.
arules
살펴볼 가치가 있습니다. 아마 "association rules"는 훌륭한 검색어입니다.