"자체를 물리 치는"예측 모델을 처리하는 방법?


36

저는 주요 소매점의 ML 전문가가 프레젠테이션을보고 있었는데 여기서 재고 부족 이벤트를 예측하는 모델을 개발했습니다.

시간이 지남에 따라 모델이 매우 정확 해 졌다고 가정 해 보자. 즉, 모델이 실제로 제대로 작동하면 품절 이벤트를 예상하고 피할 수 있으며 결국 품절 이벤트가 거의 또는 전혀없는 지점에 도달 할 수 있습니다. 그러나이 경우 모델을 실행할 수있는 과거 데이터가 충분하지 않거나 모델이 탈선됩니다. 재고 부족 이벤트를 나타내는 데 사용 된 것과 동일한 인과 요인이 더 이상 그렇게하지 않기 때문입니다.

그러한 시나리오를 다루기위한 전략은 무엇입니까?

또한, 반대 상황을 구상 할 수도 있습니다. 예를 들어, 추천 시스템은 두 항목이 실제로 그렇지 않은 경우에도 추천 시스템의 출력에 의해 구동되는 품목 쌍의 판매가 증가함에 따라 "자가 이행 예언"이 될 수 있습니다. 관련.

둘 다 예측 변수의 출력과 그것을 기반으로 수행되는 동작 사이에 발생하는 일종의 피드백 루프의 결과 인 것 같습니다. 이런 상황을 어떻게 다룰 수 있습니까?


7
(+1) 고등 교육과 관련된 일부 유사한 상황에서 사람들은 "자기 화하는 모델"에 대해 이야기합니다. 대학 공무원은 모델을 사용하여 특정 등록 및 재정 보조 관련 목표를 달성하기 위해 재정 지원을 수여합니다. 결과적으로 결과적으로 예비 학생의 등록 결정이 재정 지원 상으로 결정되거나 예측할 수 없음을 알게됩니다. .
rolando2

이 질문은 상황에 따라 약간 다르기 때문에 일반적으로 대답하기가 어렵습니다. 재고가없는 경우 좋은 해결책이 있지만 권장 사항의 경우 모델이 약간 규범 적이면 큰 문제가 없을 수 있습니다.
Dennis Jaheruddin

답변:


15

품절 (OOS) 감지 모델이 자체 탈선 될 수있는 두 가지 가능성이 있습니다.

  1. 입력과 OOS의 관계는 시간이 지남에 따라 변경 될 수 있습니다. 예를 들어, 프로모션으로 인해 OOS가 높아질 수 있습니다 (프로모션 판매는 일반 판매보다 예측하기가 더 어렵습니다. 부분적으로 평균 판매 증가뿐만 아니라 판매 차이 도 있고 "예측하기 어렵다"는 경우 종종 OOS로 해석 됨) 그러나 시스템과 그 사용자는 이것을 배우고 판촉 용 추가 재고를 쌓을 수 있습니다. 잠시 후 프로모션과 OOS 간의 원래 관계는 더 이상 유지되지 않습니다.

    이것을 종종 "모델 전환" 또는 이와 유사 합니다. 모델을 조정하여 극복 할 수 있습니다. 가장 일반적인 방법은 입력에 가중치를 다르게 지정하여 이전 관측치에 가중치를 낮추는 것입니다.

  2. 예측 변수와 OOS 간의 관계가 변경되지 않더라도 예측 변수의 분포가 변경 될 수 있습니다. 예를 들어, 특정 재고 유지 단위 (SKU)의 판매가 0 일인 며칠이 OOS를 신호 할 수 있습니다. 그러나 모델의 성능이 좋으면 OOS가 전반적으로 감소 할 수 있으며 단순히 판매가 0 인 시퀀스가 ​​많지 않을 수 있습니다 .

    예측 변수 분포의 변화는 문제가되지 않습니다. 모델은 단순히 낮은 확률의 OOS를 출력합니다.


결국, 당신은 아마 너무 걱정할 필요가 없습니다. OOS는 전혀 없습니다. 위와 같은 피드백 메커니즘이 발생하지만 OOS가 완전히 제거 될 때까지 작동하지 않습니다.

  • 보류중인 일부 OOS는 단순히 회피 할 수 없습니다. "선반에 한 대의 장비가 있으며 앞으로 5 주 동안 5 개의 수요가있을 것입니다. 그러나 다음 배송은 오늘부터 1 주일입니다."
  • 일부 OOS이 될 것입니다 매우 그들이 경우에도 예측하기 어려운 있다 그들은 시간에 알려져 더라면 피할 수있는. "만약 우리가 팔레트를 지게차에서 떨어 뜨려 모든 제품을 파기한다는 것을 알았다면 다른 것을 주문했을 것입니다."
  • 소매 업체는 높은 서비스 수준을 목표로해야하지만 100 % 달성 할 수는 없다는 것을 알고 있습니다. 사람들은 특정 제품에 들어 와서 전체 주식을 구매합니다. 이것은 예측하기 어렵고 (위 참조) 이런 일이 발생할 가능성에 선반을 채우고 싶지 않은 경우는 거의 없습니다. 파레토의 법칙을 비교해보십시오. 서비스 수준 80 % (또는 90 %)는 달성하기가 쉽지만 99.9 %는 훨씬 더 어렵습니다. 일부 OOS는 의식적으로 허용됩니다.
  • 무어의 법칙 과 유사한 점이 있습니다. ML이 향상 될수록 더 많은 기대치가 높아지고 사람들이 모델의 삶을 더 힘들게 만들 것입니다. OOS 탐지 (및 예측) 알고리즘이 개선되는 동안 소매 업체는 우리의 삶을 더욱 어렵게 만듭니다.
    • 예를 들어 변형 증식을 통해. 20 가지 맛보다 4 가지 맛의 요구르트에서 OOS를 감지하는 것이 더 쉽습니다. 왜? 사람들은 요구르트를 5 배나 많이 먹지 않기 때문입니다. 대신, 거의 변하지 않은 총 수요가 현재 5 배 많은 SKU에 분산되어 있으며 각 SKU의 주식은 이전보다 5 분의 1이 높습니다. 롱테일이 확대되고 신호가 약해지고 있습니다.
    • 또는 자신의 기기를 사용하여 모바일 결제를 허용합니다. 이로 인해 좀도둑에 대한 심리적 장벽낮아질 수 있으므로 시스템 인벤토리는 기존 보다 훨씬 나빠질 것 입니다. 물론 시스템 인벤토리는 아마도 OOS에 가장 적합한 예측 기일 것입니다.

저는 12 년이 넘는 기간 동안 소매 판매를 예측하는 일을 해왔 기 때문에 이와 같은 개발에 대한 아이디어가 조금 있습니다.


비관적 일지 모르지만 OOS 탐지 이외의 다른 ML 사용 사례에서도 매우 유사한 효과가 작동한다고 생각합니다. 또는 이것은 비관적이지 않을 수도 있습니다. 문제가 결코 "해결되지 않을 것"을 의미하므로 지금부터 수십 년 동안 우리에게는 여전히 일이있을 것입니다.


나는 당신의 마지막 의견에 특히 동의합니다. 이 시나리오의 최악의 버전은 완전 고용 / 무료 점심 정리의 출발점처럼 보입니다. 이것이 흥미로운 질문 IMO가되는 이유입니다!
senderle

26

당신이 시스템에 개입에 대한 의사 결정을 지원하는 모델을 사용하는 경우, 논리적으로,이 모델은 결과를 예측하기 위해 노력해야한다 조절 주어진 개입에 있습니다. 그런 다음 별도로 예상되는 결과가 가장 좋은 개입 을 선택하도록 최적화 해야 합니다 . 자신의 개입을 예측하려고하지 않습니다.

이 경우 모델은 수요 (직접 제어하지 않는 변수)를 예측할 수 있으며이를 재고 선택과 함께 사용하면 재고 부족 이벤트가 발생하거나 발생하지 않을 수 있습니다. 모델은 수요 이기 때문에 수요를 정확하게 예측 하기 위해 계속 "보상"되어야합니다 . 품절 이벤트와 함께이 변수에 따라 달라집니다 당신의 스타킹 선택.


2
이것이 실제로 실제로 해결되는 방법입니다. 추진 요소에 대한 이해를 제공하지는 않지만 수요일에 재고 부족이 발생할 것으로 예상하는 블랙 박스 모델은 사람들이 가정을 이해할 수없는 경우 사용이 매우 제한적일 것이라고 예측합니다. (모델이 제자리에 없다고 가정합니다.)
Dennis Jaheruddin

@DennisJaheruddin : 반면에,시기 적절한 재주문에도 불구하고 제품의 재고가 없을 때 예측할 수있는 모델을 만들어 죽일 수 있습니다.
Joshua

1
사용 된 모델에서는 수요 신호가 한 가지 요인에 불과하기 때문에 그보다 조금 더 복잡합니다. 그러나 매장 조건에 따라 다른 요인을 사용하여 재고가 매장에 있지만 선반에는 없었던 상황 (예 : 고객이 변경했기 때문에 백룸이나 금전 등록기 또는 서비스 데스크 중 하나) 마지막 순간에 그들의 마음). 이를 위해 그들은 수요 만 사용하는 것이 아니라 다른 인과 적 요인도 사용했습니다.
Skander H.

@Alex는 복잡성이 모델이 명시 적으로 표현하는지 여부에 관계없이 다른 위치를 관리하는 간단한 공급 / 수요 메커니즘 네트워크에 해당합니다. 모델의 목표는 수요가 아닌 재고 수준을 예측하는 것으로보다 정확하게 설명되지만 재고가있는 네트워크 (선반)의 시점에서 공급과 수요 모두에 통제되지 않은 요인이 있다고 생각하는 경우에만 관련이 있습니다. 레벨이 중요합니다. 재고를 더 많이 주문하거나 선반을보다 정기적으로 보충하는 직원을 확보하는 것과 같은 개입은 여전히 ​​모델의 요소가되어야합니다.

수요가 재고에 따라 달라질 가능성을 언급 할 수 있습니다.
Yakk

9

재입고 이벤트가 발생한시기를 추적 할 수 있습니다. 그렇다면 재고를 재입고하는 데 모델을 사용하지 않았을 때 재고가 고갈되는 시점을 해결하는 것은 산술 문제 일뿐입니다.

이는 긍정적 인 재고 수준이 판매 수준과 무관하다고 가정합니다. • 어떤 제안자는이 가정이 실제로 적용되지 않는다고 말합니다. 어느 쪽도 모르겠습니다. 소매 데이터 세트에서는 일하지 않습니다. 그러나 단순화를 위해 제안 된 접근 방식은 반추 론적 추론을 사용하여 추론 할 수있게합니다. 이 단순화가 너무 비현실적인지 여부는 의미있는 통찰력을 제공하는 데 달려 있습니다.


이것이 어떻게 질문에 대답하는지 모르겠습니다. 내가 이해하는 문제는 다음과 같다 : (a) 생산에서 모델을 구현 한 후, 재고 분포에 대한 최적 예측 기능은 데이터 분포를 변경했기 때문에 이전과 완전히 다르다. (b) 모델이 좋을수록 재고가 줄어드는 이벤트가 더 많아 지므로 앞으로 정확하게 예측하기가 더 어려워집니다. "재고를 위해 재고를 사용하지 않았을 때 재고가 고갈 될 때"를 아는 것은 여기에서 또는 그 어느 때에도 모델이 생산되고 있지 않기 때문에 알 수 없습니다
Jake Westfall

@JakeWestfall이 유형의 분석을 반추 론적 추론이라고합니다. 재고를 항상 알고 있고 재입고 된시기를 알고있는 경우 재입고가 발생하지 않았다고 가정하는 사실을 반박 할 수 있습니다. 재입고가 발생한 후 재고에서 재입고를 빼기 만하면됩니다. 이제 재입고하지 않은 가정을 반영하는 시계열이 있습니다. 이 시계열을 재고가 없어 질 때까지 옮깁니다. 재입고없이 재고가 언제 발생했는지 알 수 있습니다. 이 반상은 어떻게 다른 데이터 배포를 가지고 있습니까?
Reinstate Monica

나는 모든 것을 이해합니다. 내가 이해하지 못하는 것은 이것이 OP에서 제기 된 문제를 어떻게 해결하는지입니다. 예를 들어, 재고 부족에 대한 강력한 예측 변수가 한 달의 첫 날인지 (많은 사람들이 돈을 지불 할 때) 여부를 가정합니다. 새 모델을 사용하면 매월 말에 더 많은 단위를 선제 적으로 주문함으로써 이러한 재고 부족 이벤트를 피할 수 있습니다. 따라서 이제 "매월 1 일"은 더 이상 재고를 예측하는 데 유용하지 않습니다. 우리는 선점없이 주문한 달의 첫 달에 실제로 반품 가능성을 계산할 수 있었지만, 이것이 정확히 어떻게 우리에게 도움이됩니까?
Jake Westfall

2
재입고가 발생하지 않았을 가능성이 있습니다. OP는 재고 부족 발생을 줄이는 모델이 미가공 데이터에서 이용 가능한 재고 부족이 많지 않다는 사실을 "처리하는 방법"을 묻고 있습니다. 내 요점은 재고 실사에 반하는 사실에 대해 추론하고이를 대리로 사용할 수 있다는 것입니다. 어떤 도움을 원하십니까?
복원 Monica Monica

1
@ Sycorax : 구매자 행동은 선반에 보이는 항목 수에 영향을받지 않는다고 가정합니다. 그것은 잘못된 가정입니다. 영향이 약할 수는 있지만 결석은 없습니다.
벤 Voigt

7

여러분의 시나리오는 경제학 에서 Lucas Critique 와 많은 유사점을 가지고 있습니다. 기계 학습에서는이를 " 데이터 세트 이동 "이라고합니다.

@Sycorax가 명시 적으로 모델링하여이를 극복 할 수 있습니다.


2

기억해야 할 것은 ML이 도구적인 목표라는 것입니다. 궁극적으로 품절 이벤트를 예측하지 않고 품절 이벤트를 방지하려고합니다. 품절 이벤트를 예측하는 것은 단순히 그 목적을위한 수단입니다. 따라서 유형 II 오류에 관한 한 이것은 문제가되지 않습니다. 우리는 OOSE를 계속 보유하고 있는데,이 경우 모델 훈련을위한 데이터가 있거나, 그렇지 않은 경우에는 모델이 해결하기 위해 모델이 생성 한 문제가 해결되지 않습니다. 문제는 유형 I 오류입니다. 곰 순찰 에 빠지기 쉽다Y를 방지하기 위해 구축 된 시스템 X가있는 오류는 Y를 보지 못하므로 X가 Y를 방지한다고 결론을 내리고 X를 종료하려는 시도는 "하지만 그렇게 잘하고 있습니다. Y 방지! " Y가 다시 올 위험에 처하기를 원하지 않기 때문에 조직은 고가의 프로그램에 갇힐 수 있으며, 그러한 가능성을 허용하지 않으면 서 X가 실제로 필요한지 여부를 찾기가 어렵습니다.

그런 다음 제어 그룹을 얻기 위해 때때로 (모델에 따라) 차선책의 행동에 얼마나 많이 기꺼이 참여하고자 하는가의 절충이됩니다. 효과적인 탐사의 일부입니다. 효과적인 것으로 생각되는 약이 있다면 실제로 약효를 확인하기위한 약을받지 않는 대조군이 있어야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.