따라서이 주제에 대한 문헌을 찾을 수 없었지만 생각할 가치가있는 것처럼 보입니다.
새로운 관찰이 가능한 경우 모델 교육 및 최적화에 대한 모범 사례는 무엇입니까?
예측이 저하되기 전에 모델 재 훈련주기 / 빈도를 결정하는 방법이 있습니까?
매개 변수가 집계 된 데이터에 대해 다시 최적화되면 과적 합입니까?
학습이 반드시 온라인 일 필요 는 없습니다 . 보다 최근의 예측에서 유의 한 차이를 관찰 한 후 기존 모델을 업그레이드 할 수 있습니다.
따라서이 주제에 대한 문헌을 찾을 수 없었지만 생각할 가치가있는 것처럼 보입니다.
새로운 관찰이 가능한 경우 모델 교육 및 최적화에 대한 모범 사례는 무엇입니까?
예측이 저하되기 전에 모델 재 훈련주기 / 빈도를 결정하는 방법이 있습니까?
매개 변수가 집계 된 데이터에 대해 다시 최적화되면 과적 합입니까?
학습이 반드시 온라인 일 필요 는 없습니다 . 보다 최근의 예측에서 유의 한 차이를 관찰 한 후 기존 모델을 업그레이드 할 수 있습니다.
답변:
.pickle
파일 로 저장 하고 새 데이터를 사용할 수있을 때 모델을 로드하고 추가로 학습 할 수 있습니다. 모형이 올바르게 예측하려면 the new training data should have a similar distribution as the past data
.The frequency will be dependent on dataset
구체적으로 언급 할 시간이 없습니다. If you observe that your new incoming data is deviating vastly, then it is a good practise to retrain the model
.새로운 관측치가 제공되면 모델을 재교육하는 방법에는 세 가지가 있습니다.
오늘날 대부분의 모델은 배치 / 미니 배치를 사용 하며 배치 크기 선택은 응용 프로그램 및 모델에 따라 다릅니다. 올바른 크기의 배치를 선택하는 것은 모델을 재교육 할 올바른 빈도를 선택하는 것과 같습니다. 새로운 관측치가 기존 데이터와의 분산이 낮 으면 더 큰 배치 (256-512)를 제안하고 반대로 새로운 관측치가 기존 데이터와 크게 다를 경우 작은 배치 (8-256)를 사용하십시오. 하루가 끝나면 배치 크기는 조정 해야하는 다른 하이퍼 매개 변수와 비슷하며 데이터와 관련이 있습니다.
당신의 문제는 온라인 학습 방법의 우산 아래 온다. 데이터 스트림이 온다고 가정하면 Stochastic Gradient Descent 방법을 사용하여 해당 단일 예제를 사용하여 모델 매개 변수를 업데이트 할 수 있습니다.
비용 함수가 다음과 같은 경우 :
,
여기서 는 매개 변수 벡터이며 ( ) 형식의 스트리밍 데이터를 가정하면 SGD를 사용하여 다음 업데이트 방정식으로 매개 변수 벡터를 업데이트 할 수 있습니다.x i , y i
.
이것은 기본적으로 배치 크기가 1 인 SGD입니다.
다른 트릭이 있습니다. 창 / 버퍼 기반 방법을 채택하여 스트림에서 일부 예제를 버퍼링하고 배치로 처리하고 배치 SGD를 사용할 수 있습니다. 이 경우 업데이트 방정식은 다음과 같습니다.
.
이것은 본질적으로 미니 배치 SGD입니다.
질문 : 재 훈련해야합니까?
대답은 모델이 수행하려는 작업과 적용되는 환경에 따라 다릅니다.
몇 가지 예를 들어 설명하겠습니다.
모델이 고객의 행동을 예측하려고 시도한다고 가정합니다 (예 : 고객이 자신에게 맞는 제안을 제공하여 고객이 제품을 구매할 가능성). 분명히, 시장은 시간이 지남에 따라 변하고, 고객의 선호도는 변하고, 경쟁사는 조정됩니다. 또한 조정해야하므로 주기적으로 재 훈련해야합니다. 이 경우 새 데이터를 추가하는 것이 좋으며 더 이상 관련이없는 오래된 데이터는 생략하는 것이 좋습니다. 시장이 빠르게 변화하는 경우 새 데이터 만 기반으로 주기적으로 재교육을 고려해야합니다.
반면, 모델이 일부 이미징 (예 : 엑스레이 또는 MRI)을 의료 조건으로 분류하고 모델의 성능이 우수하면 기술이나 의료 노하우에 변화가없는 경우 재교육 할 필요가 없습니다. . 더 많은 데이터를 추가해도 크게 향상되지 않습니다.