정확도의 정의를 올바르게 이해하면 정확도 (정확하게 분류 된 데이터 포인트의 %)가 MSE (평균 제곱 오차)보다 덜 누적됩니다. 그렇기 때문에 loss
정확도가 변동하는 동안 빠르게 증가하고 있음을 알 수 있습니다 .
직관적으로 이것은 기본적으로 예제의 일부가 무작위로 분류 되어 정확한 랜덤 추측 횟수가 항상 변동하므로 변동이 발생 함을 의미합니다 (코인이 항상 "헤드"를 반환해야하는 경우 정확도를 상상하십시오). 기본적으로 노이즈에 대한 민감도 (분류가 임의의 결과를 생성 할 때)는 과적 합의 일반적인 정의입니다 (wikipedia 참조).
통계 및 기계 학습에서 가장 일반적인 작업 중 하나는 "모델"을 일련의 훈련 데이터에 맞추는 것이므로 훈련되지 않은 일반 데이터를 신뢰할 수있게 예측할 수 있습니다. 과적 합에서 통계 모델은 기본 관계 대신 임의의 오류 또는 잡음을 설명합니다.
과적 합의 또 다른 증거는 손실이 증가하고 손실이 더 정확하게 측정되며 시그 모이 드 / 임계 값에 의해 찌그러지지 않으면 시끄러운 예측에 더 민감하다는 것입니다 (손실 자체의 경우). 직관적으로, 네트워크가 출력에 대해 너무 확신하는 상황 (잘못된 경우)을 상상할 수 있으므로 임의의 오 분류의 경우 임계 값에서 멀리 떨어진 값을 제공합니다.
케이스와 관련하여 모델이 올바르게 정규화되지 않은 이유는 다음과 같습니다.
- 충분한 데이터 포인트, 너무 많은 용량
- 주문
- 기능 스케일링 / 정규화가 없거나 잘못되었습니다.
- ααα
가능한 해결책:
- 더 많은 데이터 포인트 확보 (또는 기존 포인트 세트를 인위적으로 확장)
- 하이퍼 파라미터로 재생 (예 : 용량 증가 / 감소 또는 정규화 기간)
- 정규화 : 탈락 시도, 조기 중지 등