열차와 테스트 오차를 비교하는 방법, 특히 둘 사이에 간격이있을 경우 처리 방법에 대해 상충되는 조언이있는 것 같습니다. 나에게 충돌하는 것처럼 보이는 두 개의 학교가있는 것 같습니다. 두 사람을 조정하는 방법을 이해하려고합니다 (또는 여기서 누락 된 것을 이해합니다).
생각 # 1 : 열차와 테스트 세트 성능 사이의 간격만으로는 과적 합을 나타내지 않습니다.
먼저, ( 훈련 및 테스트 오류 비교가 과적 합을 나타내는 방법은 무엇입니까? ), 열차와 시험 세트의 차이만으로 과적 합을 나타낼 수 없다는 생각입니다. 이것은 교차 검증 기반 하이퍼 파라미터 튜닝 이후에도 열차와 테스트 오류 사이의 간격이 다소 크게 유지 될 수있는 앙상블 트리 방법과 같은 실제 경험에 동의합니다. 그러나 유효성 검사 오류가 다시 발생하지 않는 한 (모델 유형에 관계없이) 좋습니다. 적어도 그 생각입니다.
생각 # 2 : 열차와 시험 성능 사이에 차이가있는 경우 : 과적 합에 맞서 싸우는 일을하십시오
그러나 열차와 테스트 오류 사이의 간격이 과적 합을 나타내는 매우 훌륭한 출처에서 알 수있는 조언이 있습니다. 예를 들면 다음과 같습니다. "딥 러닝의 너트와 볼트"Andrew Andrew (환상적인 대화) https://www.youtube.com/watch?v=F1ka6a13S9I : 타임 스탬프 48:00에 플로우 차트를 그리는 위치 "열차 세트 오류가 낮고 열차-기차 오류가 높으면 정규화를 추가하거나, 더 많은 데이터를 얻거나, 모델 아키텍처를 변경해야합니다."라고 말합니다.
어느 쪽이 나를 데려 오는가 ... : 내가 여기서 뭔가를 놓치고 있는가? 이것은 모델 고유의 경험 법칙입니까? 아니면 단순히 두 개의 다른 사고 학교가 있습니까?