Pareto / NBD 모델을 사용하는 BTYD 패키지를 사용하여 고객이 언제 돌아올 지 예측하는 방법을 배우고 있습니다. 그러나이 모델에 대한 모든 문헌은 수학으로 가득 차 있으며이 모델의 작동에 대한 단순 / 개념적 설명이없는 것으로 보입니다. 비 수학자를위한 파레토 / NBD 모델을 이해할 수 있습니까? 나는 Fader 에 의해이 유명한 논문을 겪었다 . 파레토 / NBD 모델은 다음과 같은 가정을합니다.
나는. 활성 상태 인 동안, 길이 t의 기간에 고객에 의해 이루어진 트랜잭션의 수는 트랜잭션 속도 λ로 포아송에 분배된다.
ii. 고객 전체의 거래 율 이질성은 모양 매개 변수 r 및 스케일 매개 변수 α를 사용한 감마 분포를 따릅니다.
iii. 각 고객에게는 길이 τ의 관찰되지 않은 "수명"이 있습니다. 고객이 비활성 상태가되는 시점은 탈락률 µ로 지수가 분산됩니다.
iv) 고객에 따른 드롭 아웃 이질성은 모양 매개 변수 s 및 스케일 매개 변수 β의 감마 분포를 따릅니다.
v. 거래 율 λ와 탈락률 µ는 고객마다 독립적으로 다릅니다. "
나는 가정 (ii), (iii) 및 (iv)의 이론적 근거를 이해하지 못한다. 왜이 배포판 만, 다른 배포판은 그렇지 않습니까?
또한 BG / NBD 모델 가정은 다음과 같습니다.
i.) 활성 상태 인 동안 고객이 수행 한 트랜잭션 수는 트랜잭션 속도 λ로 Poisson 프로세스를 따릅니다. 이것은 트랜잭션 사이의 시간이 트랜잭션 속도 λ로 지수 분포되어 있다고 가정하는 것과 같습니다.
ii) λ의 이질성은 감마 분포를 따른다
iii) 거래 후 고객은 확률 p. 따라서 pmf를 사용하여 (이동 된) 기하 분포에 따라 고객이 "탈락"하는 지점이 트랜잭션에 분산됩니다.
iv) p에서의 이질성은 베타 분포를 따른다
가정 (ii), (iii) 및 (iv)의 (직관적 인) 합리성도 전혀 분명하지 않습니다.
도움을 주셔서 감사합니다. 감사.