나의 주요 질문은 k- 폴드 교차 검증이 훈련 / 검증 / 테스트 세트를 갖는 맥락에서 어떻게 맞는지 이해하려고 노력하는 것과 관련이 있습니다 (그러한 맥락에서 전혀 적합하다면).
일반적으로 사람들은 데이터를 훈련, 검증 및 테스트 세트 (앤드류 응 코스 당 60/20/20의 비율)로 분할하여 검증 세트가 모델 훈련을위한 최적의 파라미터를 식별하는 데 사용된다고 말합니다.
그러나 데이터 양이 상대적으로 적을 때보다 대표적인 정확도 측정 값을 얻기 위해 k- 폴드 크로스 밸리데이션을 사용하고자한다면 k- 폴드 크로스 밸리데이션이이 60/20/20 스플릿에서 정확히 수행되는 것은 무엇입니까? 대본?
예를 들어, 실제로 훈련 및 테스트 세트 (데이터의 80 %)를 결합하고 정확도 측정 값을 얻기 위해 k- 폴드 교차 검증을 수행한다는 것을 의미합니까 (명시적인 '테스트 세트'를 갖는 것을 효과적으로 버림)? 그렇다면 어떤 훈련 된 모델을 a) 생산에 사용하고 b) 검증 세트에 대해 사용하고 최적의 훈련 매개 변수를 식별합니까? 예를 들어, a와 b에 대한 한 가지 가능한 대답은 아마도 가장 좋은 모델을 사용하는 것입니다.