작은 표본 크기 데이터에 대한 훈련, 교차 검증 및 테스트 세트 크기를 선택하는 방법은 무엇입니까?


10

샘플 크기가 작고 (예 : N = 100) 두 개의 클래스가 있다고 가정합니다. 머신 러닝을위한 교육, 교차 검증 및 테스트 세트 크기를 어떻게 선택해야합니까?

나는 직관적으로 선택합니다

  • 훈련 세트 크기는 50
  • 교차 검증 세트 크기 25 및
  • 테스트 크기는 25입니다.

그러나 아마도 이것은 다소 의미가 있습니다. 이 값들을 어떻게 결정해야합니까? 다른 옵션을 시도해 볼 수 있습니까 (그렇지 않은 것으로 생각되지만 과도한 학습 가능성이 높아짐)?

수업이 두 개 이상이면 어떻게 되나요?


2
100은 나에게 너무 작습니다. 교차 검증 및 테스트 평가 모두에 대한 일회성 전략을 선택합니다.
Memming

나는 이것에 대한 문헌을 보지 못했다 (유효성을위한 최소 샘플 크기). 이유가 확실하지 않습니다. 중요한 문제인 것 같습니다.
찰스

답변:


15

매개 변수 최적화 및 모델 복잡성에 대한 조언만으로 +1. 그러나이 모든 조언은 환상적입니다.
찰스

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.