교차 유효성 검사 프로세스에 대한 질문이 있습니다. 저는 Cursera에서 기계 학습 과정을 진행 중입니다. 주제 중 하나는 교차 검증에 관한 것입니다. 따라하기가 약간 어렵다는 것을 알았습니다. 미래의 (알 수없는) 데이터에서 모델이 잘 작동하고 CV가 과적 합을 방지하기 때문에 CV가 필요한 이유를 알고 있습니다. 그러나 프로세스 자체는 혼란 스럽습니다.
내가 이해 한 것은 데이터를 교육, 유효성 검사 및 테스트의 세 가지 하위 집합으로 나눕니다. 학습 및 검증은 모델의 최적의 복잡성을 찾는 것입니다. 내가 이해하지 못하는 것은 세 번째 하위 집합입니다. 모델에 대한 여러 가지 기능을 사용하여 학습하고 유효성 검사 하위 집합에서 모델을 검증하고 구조를 변경할 때 최소 비용 함수를 찾습니다. 찾았을 때 테스트 하위 세트에서 모델을 테스트합니다. 유효성 검사 하위 집합에서 이미 최소 비용 함수를 찾았다면 왜 테스트 하위 집합에서 다시 테스트해야합니까 ???
누군가 나를 위해 이것을 명확히 해 주시겠습니까?
고맙습니다