설명서 http://keras.io/optimizers/ 를 보면 SGD에 부패에 대한 매개 변수가 있습니다. 이것이 시간이 지남에 따라 학습 속도가 감소한다는 것을 알고 있습니다. 그러나 정확히 어떻게 작동하는지 알 수 없습니다. lr = lr * (1 - decay)
지수 등의 학습률을 곱한 값 입니까? 또한 모델에서 사용중인 학습 속도를 어떻게 확인할 수 있습니까? model.optimizer.lr.get_value()
몇 번의 에포크 (epoch)에 맞추기 후에 인쇄 하면 부패를 설정하더라도 원래 학습 속도를 돌려줍니다.
또한 운동량을 사용하려면 nesterov = True를 설정해야합니까, 아니면 사용할 수있는 운동량 유형이 두 가지뿐입니까? 예를 들어 이것을 할 요점이 있습니까?sgd = SGD(lr = 0.1, decay = 1e-6, momentum = 0.9, nesterov = False)
self.iterations
개별 SGD 공정 수가 아닌 시대의 개수를 의미 rigt?