운동량 항과 함께 역 전파 알고리즘을 사용하여 신경망의 가중치를 업데이트 할 때 학습 속도도 운동량 항에 적용되어야합니까?
운동량 사용에 대해 찾을 수있는 대부분의 정보는 다음과 같은 방정식을 갖습니다.
어디 학습률이며 운동량 항입니다.
만약에 용어가 다음 반복에서 용어 이전 반복에서 현재 반복보다 가중치에 더 큰 영향을 미칩니다.
이것이 모멘텀 기간의 목적입니까? 또는 방정식이 다음과 같이 보일까요?
즉. 학습 속도로 모든 것을 확장?