분류와 같은 간단한 기계 학습 문제가 있다고 가정 해보십시오. 비전 또는 오디오 인식에 대한 일부 벤치 마크에서, 나는 인간으로서 매우 훌륭한 분류 자입니다. 그러므로 나는 분류자가 얼마나 잘 얻을 수 있는지에 대한 직감을 가지고 있습니다.
그러나 많은 데이터를 통해 한 가지 요점은 내가 훈련시키는 분류 기가 얼마나 좋은지 알 수 없다는 것 입니다. 이것은 내가 개인적으로 아주 좋은 분류자가 아닌 데이터입니다 (즉, EEG 데이터에서 사람의 기분을 분류하십시오). 내 문제가 얼마나 어려운지 직관을 얻는 것은 실제로 불가능합니다.
이제 기계 학습 문제가 발생하면 얼마나 잘 얻을 수 있는지 알고 싶습니다. 이것에 대한 원칙적인 접근법이 있습니까? 어떻게 하시겠습니까?
데이터를 시각화 하시겠습니까? 간단한 모델로 시작 하시겠습니까? 매우 복잡한 모델로 시작하여 과적 합할 수 있는지 확인하십시오. 이 질문에 대답하려면 무엇을 찾고 있습니까? 언제 시도를 중단합니까?