훈련 세트에 대해 여러 모델을 훈련시키고 교차 검증 세트를 사용하여 최상의 모델을 선택하고 테스트 세트에서 성능을 측정했다고 가정합니다. 이제 최종 최고의 모델이 하나 있습니다. 사용 가능한 모든 데이터 또는 훈련 세트에 대해서만 훈련 된 선박 솔루션에 대해 교육해야합니까? 후자의 경우 왜?
업데이트 : @ P.Windridge가 지적했듯이 재교육 모델을 배송하는 것은 기본적으로 유효성 검사없이 모델을 배송하는 것을 의미합니다. 그러나 우리는 테스트 세트 성능을보고 할 수 있으며, 그 후에는 최상의 모델과 더 많은 데이터를 사용하기 때문에 성능이 향상 될 것으로 기대되는 완전한 데이터에 대해 모델을 재교육 할 수 있습니다. 그러한 방법론에서 어떤 문제가 발생할 수 있습니까?