파레토 / nbd 모델을 개념적으로 이해할 수 있습니까?


12

Pareto / NBD 모델을 사용하는 BTYD 패키지를 사용하여 고객이 언제 돌아올 지 예측하는 방법을 배우고 있습니다. 그러나이 모델에 대한 모든 문헌은 수학으로 가득 차 있으며이 모델의 작동에 대한 단순 / 개념적 설명이없는 것으로 보입니다. 비 수학자를위한 파레토 / NBD 모델을 이해할 수 있습니까? 나는 Fader의해이 유명한 논문을 겪었다 . 파레토 / NBD 모델은 다음과 같은 가정을합니다.

나는. 활성 상태 인 동안, 길이 t의 기간에 고객에 의해 이루어진 트랜잭션의 수는 트랜잭션 속도 λ로 포아송에 분배된다.

ii. 고객 전체의 거래 율 이질성은 모양 매개 변수 r 및 스케일 매개 변수 α를 사용한 감마 분포를 따릅니다.

iii. 각 고객에게는 길이 τ의 관찰되지 않은 "수명"이 있습니다. 고객이 비활성 상태가되는 시점은 탈락률 µ로 지수가 분산됩니다.

iv) 고객에 따른 드롭 아웃 이질성은 모양 매개 변수 s 및 스케일 매개 변수 β의 감마 분포를 따릅니다.

v. 거래 율 λ와 탈락률 µ는 고객마다 독립적으로 다릅니다. "

나는 가정 (ii), (iii) 및 (iv)의 이론적 근거를 이해하지 못한다. 왜이 배포판 만, 다른 배포판은 그렇지 않습니까?

또한 BG / NBD 모델 가정은 다음과 같습니다.

i.) 활성 상태 인 동안 고객이 수행 한 트랜잭션 수는 트랜잭션 속도 λ로 Poisson 프로세스를 따릅니다. 이것은 트랜잭션 사이의 시간이 트랜잭션 속도 λ로 지수 분포되어 있다고 가정하는 것과 같습니다.

ii) λ의 이질성은 감마 분포를 따른다

iii) 거래 후 고객은 확률 p. 따라서 pmf를 사용하여 (이동 된) 기하 분포에 따라 고객이 "탈락"하는 지점이 트랜잭션에 분산됩니다.

iv) p에서의 이질성은 베타 분포를 따른다

가정 (ii), (iii) 및 (iv)의 (직관적 인) 합리성도 전혀 분명하지 않습니다.

도움을 주셔서 감사합니다. 감사.


어려운 문헌에 대한 언급을 추가 할 수 있습니까?
kjetil b halvorsen

상황이 불분명 한 부분을 자세히 설명했습니다. 나는 직관을하는 것이 쉽지 않다는 것을 알고 있지만 가능하다면 큰 도움이 될 것입니다. 감사.
user3282777

답변:


14

새로 임명 된 꽃집 관리자라고 상상해보십시오. 작년 고객에 대한 기록이 있습니다. 고객이 쇼핑하는 빈도 및 마지막 방문 이후의 시간입니다. 올해 상장 된 고객이 얼마나 많은 비즈니스를 유치 할 것인지 알고 싶습니다. 고려해야 할 몇 가지 사항이 있습니다.

[가정 (ii)] 고객의 쇼핑 습관이 다릅니다.

어떤 사람들은 항상 신선한 꽃을 좋아하지만 다른 사람들은 특별한 경우에만 꽃을 피 웁니다. 단 하나의 가 모든 사람의 행동을 설명 한다고 가정하지 않고 트랜잭션 속도 대한 분포를 갖는 것이 더 합리적 입니다.λλ

분포에는 매개 변수가 거의 필요하지 않으며 (데이터가 많을 필요는 없음) 상당히 유연해야합니다 (아마도 독서를하는 기업가가 아니며 쇼핑 습관에 대해 모두 알지 못함). 양의 실수로 된 값. 감마 배포판은 이러한 모든 상자를 선택하고 잘 연구되고 비교적 작업하기 쉽습니다. 다른 설정에서 양수 매개 변수의 선행으로 자주 사용됩니다.

[가정 (iii)] 목록에있는 일부 고객을 이미 잃었을 수 있습니다.

안드레아가 작년에 한 달에 한 달에 한 달에 한 번 꽃을 사면 올해 돌아 오는 것이 안전합니다. 벤이 매주 꽃을 사곤했지만 몇 달 동안 가지 않았다면 다른 꽃집을 찾은 것 같습니다. 향후 사업 계획을 수립 할 때는 Andrea가 아닌 Ben을 의지 할 수 있습니다.

고객은 고객이 이동 한 시점을 알려주지 않으며 두 모델 모두에서 "수명되지 않은 수명"가정이 시작됩니다. 세 번째 고객 인 캐리를 상상해보십시오. Pareto / NBD 및 BG / NBD 모델을 사용하면 매장에서 Cary가 좋은 결과를 가져 오는 것에 대해 두 가지 다른 방법으로 생각할 수 있습니다.

파레토 / NBD 사건의 경우, 어느 시점에서나 캐리가 당신보다 더 나은 상점을 발견 할 가능성이 적다고 상상해보십시오. 이 무한한 무한 위험은 지수 수명을 제공하며 Cary의 마지막 방문 이후 오래 지속 될수록 다른 (잠재적으로 더 좋은) 꽃집에 더 오래 노출되었습니다.

BG / NBD 사례는 조금 더 고안되었습니다. 캐리가 당신의 가게에 도착할 때마다, 그는 꽃을 사기 위해 최선을 다하고 있습니다. 탐색하는 동안 마지막 방문 이후 가격, 품질 및 다양성의 변화를 고려하여 궁극적으로 다음에 다시 올지 또는 다른 상점을 찾을 지 결정할 수 있습니다. 따라서 Cary는 지속적으로 위험을 감수하기보다는 매 구매 후 떠나기로 결정할 가능성이 있습니다.

[가정 (iv)] 모든 고객이 당신의 가게에 똑같이 헌신하는 것은 아닙니다.

일부 고객은 정기적이며 사망 또는 급격한 가격 인상만으로 인해 고객이 떠나게됩니다. 다른 사람들은 탐험하고 싶을 수도 있고 길 건너편의 새로운 힙 스터 꽃집을 위해 행복하게 떠날 것입니다. 모든 고객에 대해 단일 탈락률이 아니라 탈락률 (또는 BG / NBD 사례의 확률)을 분배하는 것이 더 합리적입니다.

이것은 쇼핑 습관과 같은 맥락에서 매우 효과적입니다. 우리는 매개 변수가 적은 유연하고 확립 된 배포를 마쳤습니다. Pareto / NBD의 경우 rate 는 양의 실수 이므로 감마를 사용 합니다. BG / NBD의 경우 베타를 사용합니다. 베타는 매개 변수에 대한 표준 우선 순위 입니다.μ(0;1)

이게 도움이 되길 바란다. 아직 작성하지 않은 경우 원본 논문 (Schmittlein et al., 1987)을 살펴보십시오. 직관이 약간 있습니다.


이러한 노력과 명확한 설명에 감사드립니다. 감마 분포를 사용하는 이유는 작업하기가 비교적 쉽고 다른 설정에서 긍정적 인 매개 변수의 선행으로 자주 사용되기 때문입니다. 대부분의 감마 분포 (모수 값이 다른)의 형태는 이해하기 쉽지만 '고객 간 거래 율의 이질성'은 기하 급수적으로 감소하는 감마 분포에 적합합니다 (k = 1의 경우 Wikipedia 그래프에서와 같이 k = 1의 경우 theta = 2). here] en.wikipedia.org/wiki/Gamma_distribution )을 이해하기는 어렵습니다. 우리는 그러한 행동을 배제합니까?
user3282777

1
감마 매개 변수에 대한 추정치는 작업중인 데이터에 따라 다릅니다. 요점은 감마 분포가 단지 두 개의 매개 변수를 기반으로 크게 다른 모양을 가질 수 있으며 지나치게 엄격한 가정을 부과하지 않고 데이터 자체를 말할 수 있다는 것입니다.
Lyuba B.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.