제품의 총 판매량을 예측하는 모델을 개발 중입니다. 약 1 년 반의 예약 데이터가 있으므로 표준 시계열 분석을 수행 할 수 있습니다. 그러나 나는 또한 닫히거나 잃어버린 각 '기회'(잠재 판매)에 대한 많은 데이터를 가지고 있습니다. '기회'는 폐쇄되거나 손실 될 때까지 파이프 라인의 단계를 따라 진행됩니다. 또한 잠재 구매자, 영업 사원, 상호 작용 기록, 산업, 예상 예약 크기 등에 대한 데이터를 연결했습니다.
나의 목표는 궁극적으로 전체 예약을 예측하는 것이지만, 예약의 진정한 '근본 원인'인 현재 '기회'에 대한 모든 정보를 설명하고 싶습니다.
내가 가지고있는 한 가지 아이디어는 다음과 같이 두 가지 모델을 직렬로 사용하는 것입니다.
역사적인 '기회'를 사용하여 개별 '기회'에서 발생하는 예약을 예측하는 모델을 작성하십시오 (이 단계에서는 임의의 숲이나 평범한 오래된 선형 회귀를 사용할 것입니다).
1의 모형을 사용하여 현재 파이프 라인에있는 모든 '기회'의 예상 예약을 예측 한 다음 각 '기회'가 작성된 달을 기준으로 이러한 추정치를 합산하십시오.
1.5 년의 월별 과거 시계열 데이터와 해당 달에 생성 된 모든 '기회'에 대한 예측 된 총 예약 수 (1에서 모델 사용)를 사용하여 시계열 모델 (아마 마 ARIMA?)을 사용하십시오.
실제 예약으로 전환 할 수있는 기회에는 지연이 있지만 시계열 모델은 지연을 처리 할 수 있어야합니다.
이 소리는 어때? 나는 시계열과 판매 예측에 대해 많은 것을 읽었으며, 이것이 말할 수있는 것은 다소 독특한 접근법입니다. 따라서 의견을 보내 주셔서 감사합니다.