자원 참여와 비용의 상관 관계뿐만 아니라 자원 참여 비용에 대한 수익도 고려하는 것이 현명합니다. 일반적인 과제는 이러한 수익이 거의 항상 누적되거나 지연된다는 것입니다. 축적의 경우는 자원이 프로세스의 지속적인 조정 또는 개선 인 경우 부재시 수익 생성이 느려진다. 연구 자원이 일정 기간 동안 수익에 영향을 미치지 않으면 서 비용을 발생시키는 경우가 지연되지만, 연구 결과가 생산적인 결과를 제공 할 때 시작되는 수익 창출은 전달 된 결과의 총 비용을 크게 상회 할 수 있습니다.
비용 데이터 자체가 부적응 네트워크 학습으로 이어질 수있는 이유는 예를 들어 마케팅 비용을 줄 이도록 훈련 된 네트워크가이를 제로로하기 때문입니다. 일반적으로 사업이 중단 될 때까지 판매 리드 추세가 감소합니다. 훈련 정보에 답을 포함시키지 않으면 유용한 학습이 이루어지지 않을 수 있습니다.
기본 MLP (Multi-layer Perceptron)는 데이터의 시간적 특성, 누적 및 지연 측면을 학습하지 않습니다. 상태 저장 네트워크가 필요합니다. 이 글을 쓰는 시점에서 이런 종류의 학습에 가장 일관되게 성공한 네트워크 유형은 LSTM (long short term memory) 네트워크 유형 또는 파생 변형 중 하나입니다. 제안 된 자원 참여 순서 (완전히 상세한 예산 계획)에 대한 비즈니스 결과를 예측할 수 있도록 네트워크를 교육하기 위해 수익 및 균형 데이터를 비용 데이터와 함께 사용해야합니다.
손실 함수는 중기 및 장기 재무 목표와 정렬 용어의 균형을 적절히 맞춰야합니다. 부정적인 가용 현금은 손실 기능을 현저히 증가시켜 평판에 대한 기본적인 위험 회피와 신용 비용을 배웁니다.
데이터의 어떤 열이 투자 수익 (ROI)과 강한 상관 관계가 있는지 미리 결정하기는 어렵습니다. 다음 기준 중 하나를 따르는 열을 즉시 제외 할 수 있습니다.
- 항상 비워
- 다른 상수, 모든 행에 대해 동일한 값을 갖는 상수
- 항상 다른 열에서 파생 될 수있는 것
다른 방법으로 데이터를 줄일 수 있습니다
- 간단한 방법으로 트렌드를 특성화하여 데이터를 완전히 설명
- 각 문자열에 숫자를 할당하여 인덱스를 사용하여 100 % 정확도로 긴 문자열을 지정
- 압축
- 그렇지 않으면 데이터의 중복성을 줄입니다.
RBM (제한된 Boltzmann 기계)은 데이터에서 기능을 추출 할 수 있으며 PCA는 정보량이 적은 열을 비출 수 있지만 수익과의 상관 관계에서 열의 중요성은 이러한 장치를 기본 형식으로 사용하여 식별되지 않습니다.