신경망을 훈련 할 때 훈련 예제가 너무 적습니까?


14

첫 프로젝트를 시작하려고하는 초보자입니다. 곡 분류 프로젝트를 염두에 두었지만 수동으로 레이블을 지정하기 때문에 약 1000 곡 또는 60 시간의 음악 만 합리적으로 정리할 수있었습니다.

나는 여러 클래스로 분류하고 있으므로 한 클래스는 훈련 세트에서 50-100 곡의 노래를 가질 수 있습니다. 이것은 너무 적은 것 같습니다! 신경망을 훈련시키는 데 필요한 데이터 양에 대한 일반적인 경험 규칙이 있습니까?

편집 : 나는 바닐라 LSTM을 사용하려고 생각했습니다. 입력 피처의 치수는 39, 출력 치수는 6이며 숨겨진 레이어 치수에 대한 첫 번째 시도는 100입니다.


2
모든 작업이 쉬운 것은 아니며, 다른 네트워크 아키텍처와 하이퍼 파라미터를 선택하면 다른 방식으로 다른 모델을 개선 / 폐쇄 할 수 있기 때문에 이것은 실제로 대답 할 수 없습니다.
Sycorax는 Reinstate Monica

최소한 네트워크 구조와 훈련 할 링크 수를 지정해야합니다.
gung-모니 티 복원

답변:


16

실제로는 데이터 세트 및 네트워크 아키텍처에 따라 다릅니다. 내가 읽은 경험의 한 규칙 (2)은 신경망이 아주 잘 작동하기 시작하는 클래스 당 수천 샘플입니다.

실제로 사람들은 노력하고보고 있습니다. 1000 개보다 작은 훈련 세트로 적절한 결과를 보여주는 연구를 찾는 것은 드문 일이 아닙니다.


더 많은 훈련 샘플을 갖는 것이 어느 정도 유익 할 수 있는지 대략적으로 평가하는 좋은 방법은 훈련 세트의 크기를 기준으로 신경망의 성능을 플롯하는 것입니다 (예 : (1)).

여기에 이미지 설명을 입력하십시오


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.