k- 폴드 유효성 검사에 대해 읽었으며 작동 방식을 이해하고 싶습니다.
홀드 아웃 방법의 경우 데이터가 세 세트로 분할되며 테스트 세트는 모델 성능을 평가하기 위해 맨 마지막에만 사용되는 반면 검증 세트는 하이퍼 파라미터 등을 조정하는 데 사용됩니다.
k-fold 방법에서, 우리는 여전히 최종 테스트 세트를 유지하고 훈련 및 하이퍼 파라미터 튜닝을 위해 나머지 데이터 만 사용합니다. 즉, 나머지 데이터를 k 배로 나눈 다음 훈련 후 평균 정확도를 사용합니다 각 접힘 (또는 하이퍼 파라미터를 튜닝하기 위해 선택한 성능 측정 항목)과 함께? 아니면 별도의 테스트 세트를 전혀 사용하지 않고 전체 데이터 세트를 k 폴드로 간단히 분할합니까 (이 경우 k 폴드의 평균 정확도를 최종 정확도로 간주한다고 가정합니다)?