왼쪽 검열 된 데이터에 표준 기계 학습 도구 사용


11

수입 업체가 유통 업체의 고객 네트워크에서 제품 수요를 예측할 수 있도록하는 예측 애플리케이션을 개발 중입니다. 판매량은 수요를 충족시키기에 충분한 재고가있는 한 수요에 대한 대리입니다. 하지만 재고를 0으로 낮추면 (고객이 피하는 데 도움이되는 상황) 목표를 놓친 부분을 많이 알지 못합니다. 고객이 얼마나 많은 판매를했을까요? 충분한 공급이 있었습니까? Sales를 간단한 대상 변수로 사용하는 표준 회귀 기반 ML 접근 방식은 시간, 설명 변수 및 수요 간의 관계에 대한 일관된 추정치를 생성합니다.

: 토비트 모델링 문제에 접근하는 가장 확실한 방법입니다 http://en.wikipedia.org/wiki/Tobit_model을 . 데이터의 왼손 검열 구조를 설명하는 임의 포리스트, GBMS, SVM 및 신경망의 ML 적응에 대해 궁금합니다.

즉, 기계 학습 도구를 왼쪽 검열 된 회귀 데이터에 적용하여 종속 변수와 독립 변수 간의 관계를 일관되게 추정 할 수 있습니까? 우선 R에서 사용 가능한 솔루션을 선호하고 그 다음에 Python을 선호합니다.

건배,

아론


3
scikit-learn에 대한 답변을보고 싶습니다.
tobip

R에서는 cran.r-project.org/web/packages/censReg/censReg.pdf 를 사용할 수 있습니다 . 파이썬에서 scikit-learn에 대해 두 번째 @tobip
Adrian

답변:


1

즉, 기계 학습 도구를 왼쪽 검열 된 회귀 데이터에 적용하여 종속 변수와 독립 변수 간의 관계를 일관되게 추정 할 수 있습니까?

가능성을 쓰고 부호를 마이너스로 뒤집을 수 있다면 많은 기계 학습 모델에 사용할 수있는 손실 기능이 있습니다. 그라디언트 부스팅에서는 일반적으로 모델 부스팅이라고 합니다. 예를 들어, 부스팅 알고리즘 : 정규화, 예측 및 모델 피팅을 참조하십시오 .

Tobit 모델의 예로 기본 예측 용지의 Gradient Tree Boosted Tobit Models를 참조하십시오 . 이 방법은 논문에 언급 된 scikit-learn 브랜치에서 사용할 수 있어야합니다.

같은 아이디어는 예를 들어, 마우스 오른쪽 검열 데이터를 사용하는 경우, gbm그리고 mboost바로 검열 데이터에 대한 R의 패키지.

L2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.