현재 승인 된 답변이 불행히도 불완전하다고 생각합니다. 나는 문장에 동의하지 않는다
교차 유효성 검사의 목적은 각 접힘에서 학습 한 모집단 샘플에서 잘 일반화되는 학습 매개 변수를 식별하는 것입니다.
이것은 실제로 교차 검증의 매우 중요한 적용이지만 유일한 것은 아닙니다. 일반적으로 두 가지 작업을 수행하려고합니다.
- 최고의 모델을 만드십시오
- 그것이 얼마나 잘 수행되는지에 대한 정확한 인상을 얻으십시오
이제 알고리즘에 따라 목표 1을 완료하려면 일부 하이퍼 파라미터를 조정해야 할 수 있으며 이는 종종 교차 검증에 의해 수행됩니다. 그러나 이것은 목표 2를 아직 달성하지 못합니다.이를 위해서는 기본적으로 다음과 같이 교차 유효성 검사를 중첩해야합니다.
- 전체 데이터를 n 개로 분리
- 각각에 대해 훈련 데이터를 다시 접고 하위 폴더로 분리하십시오.
- 좋은 하이퍼 파라미터를 배우려면 하위 폴더에서 교차 검증을 사용하십시오.
- 이러한 하이퍼 파라미터를 사용하면 해당 접기의 훈련 데이터에 대한 모델을 구축 할 수 있습니다
- 테스트 데이터에서 모델 테스트
- 다음 배에 반복
좋은 모델을 만들려면 내부 교차 검증이 필요합니다. 좋은 모델을 얻으려면 여전히 그렇게해야합니다. 그러나 모델 성능을 제대로 평가하려면 교차 검증 체계 내에서 모델 구축의 전체 프로세스를 수행해야합니다. 여기에는 대치 등의 단계도 포함됩니다.