샘플 크기가 작고 (예 : N = 100) 두 개의 클래스가 있다고 가정합니다. 머신 러닝을위한 교육, 교차 검증 및 테스트 세트 크기를 어떻게 선택해야합니까?
나는 직관적으로 선택합니다
- 훈련 세트 크기는 50
- 교차 검증 세트 크기 25 및
- 테스트 크기는 25입니다.
그러나 아마도 이것은 다소 의미가 있습니다. 이 값들을 어떻게 결정해야합니까? 다른 옵션을 시도해 볼 수 있습니까 (그렇지 않은 것으로 생각되지만 과도한 학습 가능성이 높아짐)?
수업이 두 개 이상이면 어떻게 되나요?