아마존에서 사용자의 구매 행동을 모델링하는 방법은 무엇입니까?


9

데이터 과학의 최종 과정 프로젝트를 위해 다음을 제안했습니다.

Amazon Reviews Dataset을 제공하면 Amazon 에 광고를 배치하기위한 전략적 위치를 결정하는 알고리즘 (대략 개인화 된 PageRank 기반)을 제시 할 계획입니다. 예를 들어 아마존에는 수백만 개의 제품이 있습니다. 그리고 데이터 세트는 어떤 제품이 관련되어 있는지, 어떤 제품이 모여서 함께 보았는지 등에 대한 아이디어를 제공합니다. 14 년 이 모든 정보를 사용하여 아마존에서 제품을 평가 / 순위 화합니다. 이제 제품 페이지에 대한 트래픽을 개선하려는 Amazon 공급 업체입니다. Google 알고리즘은 최대 트래픽을 유도 할 수 있도록 광고를 게재 할 수있는 그래프의 전략적 위치를 식별하는 데 도움이됩니다.

교수님의 질문은 실제 사용자없이 알고리즘을 어떻게 검증 할 것인가입니다. 우리가 말했다-

고정 된 사용자 집합을 모델링 할 수 있습니다. 일부 사용자는 따라 also_bought하고 also_viewed첫 번째 나 다섯 번째 홉보다 더 자주 세 번째 홉에 대한 링크. 사용자의 행동은 일반적으로 배포됩니다. 일부 다른 사용자는 첫 번째 홉 이상을 거의 탐색하지 않습니다. 이 사용자 행동 세트는 기하 급수적으로 분산됩니다.

교수님의 말-사용자가 어떤 배포를하더라도 비슷한 제품에 대한 링크를 사용하여 탐색하고 있습니다. 순위 알고리즘은 또한 제품 순위를 매기는 유사성 b / w 2 제품을 고려합니다. 따라서이 유효성 검사 알고리즘을 사용하는 것이 cheating좋습니다. 알고리즘에보다 현실적이고 직교하는 다른 사용자 행동이 있습니다.

사용자 행동을 모델링하는 방법에 대한 아이디어가 있습니까? Algo에 대한 자세한 내용을 알려 드리겠습니다.

답변:


1

알고리즘의 유효성을 어떻게 확인합니까?

두 번째 질문에 답하려고하는 대신 첫 번째 질문에 대한 답을 수정해야 할 수도 있습니다.

데이터 과학 수업 전체에서 학습 방법을 검증하기 위해 어떤 방법을 사용 했습니까? 먼저 모델의 성공 또는 실패를 평가하기 위해 특정 수치 메트릭 세트 를 정의하려고합니다 . 둘째, 매우 현실적인 테스트 모집단 을 만들기 위해 어떤 방법을 사용할 수 있습니까 (인구를 모델링하는 것보다 더 현실적인가)? 내가 줄 첫 번째 힌트는 Amazon Reviews Dataset 이 매우 크기 때문에 데이터를이 방법으로 수정할 수 있다는 것입니다. 내가 줄 두 번째 힌트는이 방법이 수업 중 당신이 작업 한지도 학습 문제의 95 %에서 사용한 방법 일 것입니다 ...

희망이 도움이 되길 바랍니다 ... OP가 추가 한 의견을 기반으로 해야하는 경우이를 편집 할 것입니다. 그러나 이것은 유기적 인 생각을 이끌어 내기 위해 솔루션을 즉시 제공하고 싶지 않습니다. 또한 올바른 솔루션을 스스로 만들도록 도와 주려고 노력합니다.


0

사용해야하는 행동 모델에 대한 두 가지 요구 사항이 있습니다. (1) "보다 현실적인"및 (2) 알고리즘에 직교.

(1) 현실적으로, 행동이 아마존 구매의 특정 상황이 아닌 다른 더 넓은 상황에서 관찰 된 행동을 반영해야한다는 것을 의미한다고 가정하자.

(2) 직교는 이해하기 더 간단합니다. 모델링 된 동작은 제품 간의 유사성에 의해 주도되어서는 안됩니다.

이러한 두 가지 요구 사항을 충족시키는 간단한 접근 방식은 구매 행동이 성별, 연령, 위치 (예 : 도시 지역 / 농촌) 및 경제적 제약 (소득 및 가격)과 같은 사회 인구 통계 학적 특징에 의해 결정된다는 사실에서 비롯됩니다.

사용자 세트와 제품 세트가 있습니다. 간단하지만 신중한 회귀 기술을 사용하여 사회 인구 통계 학적 변수와 제품 수요 간의 관계를 추정 할 수 있습니다. 필요한 경우 외부 데이터 소스를 사용하여 수입과 같은 중요한 결측 변수에 대한 가정을 할 수 있습니다.

그런 다음 공급 업체 인 경우 사회 인구 통계 학적 모델은 제품을 구매할 가능성이 가장 높은 그룹을 예측합니다.

나는 그것이 도움이되기를 바랍니다 :)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.