분류기의 성능에 액세스하려면 데이터를 훈련 / 테스트 세트로 분할해야한다는 것을 알고 있습니다. 그러나 이것을 읽으십시오 :
SVM에 대해 수동으로 설정해야하는 C 설정과 같은 추정기의 다른 설정 (“하이 파라미터”)을 평가할 때 추정기가 최적으로 수행 될 때까지 매개 변수를 조정할 수 있으므로 테스트 세트에 과적 합의 위험이 여전히 있습니다. 이런 식으로 테스트 세트에 대한 지식이 모델에 "누설"될 수 있으며 평가 지표는 더 이상 일반화 성능에 대해보고하지 않습니다. 이 문제를 해결하기 위해 데이터 집합의 또 다른 부분을 소위 "유효성 검사 세트"라고 할 수 있습니다. 훈련은 훈련 세트에서 진행된 후 유효성 검사 세트에서 평가가 수행되고 실험이 성공한 것으로 보입니다 테스트 세트에서 최종 평가를 수행 할 수 있습니다.
하이퍼 파라미터 튜닝 중에 테스트 세트를 과적 합하여 정당화되는 또 다른 (제 3의) 검증 세트가 도입되었음을 알 수 있습니다.
문제는이 과잉 적합이 어떻게 나타날 수 있는지 이해할 수 없으므로 세 번째 세트의 정당성을 이해할 수 없다는 것입니다.