저는 머신 러닝과 생물 정보학을 한동안 연구 해 왔으며, 오늘 저는 데이터 마이닝의 주요 일반 문제에 대해 동료와 대화를 나누었습니다.
기계 학습 전문가 인 제 동료는 머신 러닝의 가장 중요한 실질적인 측면은 머신 러닝 모델을 훈련시키기에 충분한 데이터를 수집했는지 여부를 이해하는 방법이라고 말했습니다 .
이 말은 내가이면에서 그토록 큰 중요성을 부여하지 않았기 때문에 나를 놀라게했다 ...
그런 다음 인터넷에 대한 자세한 정보를 찾았으며 FastML.com 보고 에 대한이 게시물을 경험의 대략 10 배 많은 데이터 인스턴스 가 필요하다는 사실을 발견했습니다 .
두 가지 질문 :
1-이 문제는 특히 머신 러닝 과 관련 이 있습니까?
2 - 10 시간 작동 규칙입니다? 이 테마와 관련된 다른 소스가 있습니까?