고객 프로필에 저장되어 있습니다. 탄성 검색클러스터. 이 프로파일은 이제 이메일 구독을위한 대상 그룹을 만드는 데 사용됩니다.
대상 그룹은 이제 탄력적 검색면 검색 기능을 사용하여 수동으로 구성됩니다 (예 : 자동차 한 대와 어린이 세 대를 가진 23 세의 모든 남성 고객 확보).
데이터 과학, 기계 학습, 클러스터링 등을 사용하여 흥미로운 그룹을 자동으로 검색하려면 어떻게 해야합니까?
아르 자형프로그래밍 언어는이 작업에 유용한 도구 인 것 같지만 그룹 검색 방법론을 구성 할 수는 없습니다. 하나의 솔루션은 어떻게 든 가장 큰 고객 클러스터를 찾아 대상 그룹으로 사용하는 것이므로 질문은 다음과 같습니다.
비슷한 고객의 가장 큰 클러스터를 자동으로 선택하려면 어떻게해야합니까 (현재 알 수없는 매개 변수와 유사)?
예를 들어, 내 프로그램은 elasticsearch에 연결하고 고객 데이터를 CSV로 오프로드하고 R 언어 스크립트를 사용하면 많은 고객이 남성이없고 다른 많은 고객이 자동차를 가지고 있고 눈 색깔이 갈색임을 알 수 있습니다.
1
"흥미로운 그룹"의 의미는 무엇입니까? 미리 정의 된 중요한 기능 목록이 있습니까?
—
yatul
흥미로운 그룹은 일부 임계 값보다 큰 그룹으로 다른 가능한 클러스터보다 훨씬 큰 그룹입니다.
—
Konstantin V. Salikhov
데이터 준비 단계를 수행하는 방법이 명확하지 않습니다. 그러나 en.wikipedia.org/wiki/Anomaly_detection에 설명 된 알고리즘을 살펴 봐야 합니다. 내가 당신이라면 SVM 방법을 먼저 확인했습니다
—
yatul
SVM에 대해 읽었으며 기존 데이터 세트에 대한 수동 교육 후 새로 생성 된 데이터의 분류에 대해 더 많이 생각합니다. 기존 데이터를 클러스터링하고 비정상적으로 큰 클러스터를 찾는 것이 아닙니다. 내가 맞아? 내가 그렇다면이 방법은 내가 원하는 것이 아닙니다.
—
Konstantin V. Salikhov