레지던트 네트워크 (ResNet)가 일반 초기화를 대중화하게한다는 것을 알고있었습니다. ResNet에서는 He 일반 초기화가 사용되는 반면 첫 번째 레이어는 He 균일 초기화가 사용됩니다.
나는 ResNet 용지와 "정류기에 깊이 넣기"용지 (초기화 용지)를 살펴 보았지만 일반 초기화 대 균일 초기화에 대해서는 언급하지 않았습니다.
또한:
배치 정규화를 사용하면 훨씬 높은 학습 속도를 사용하고 초기화에 대해 덜주의 할 수 있습니다.
Batch Normalization 논문의 초록에서 Batch Normalization을 사용하면 초기화에 대해 덜주의를 기울일 수 있다고합니다.
ResNet 자체는 (정규적인 init을 사용하는 것이 아니라) 일반적인 init vs.
그래서:
- 균일 한 초기화보다 정규 분산 초기화 (He 또는 Glorot)를 언제 사용해야합니까?
- 배치 정규화에 대한 정규 분포 초기화 효과는 무엇입니까?
따로 메모 :
- Batch Normalization에서 normal init을 사용하는 것이 좋지만,이 사실을 뒷받침 할 종이는 없습니다.
- ResNet은 Glorot init보다 He init을 사용한다는 것을 알고있었습니다.
- 나는 Glorot init 대 He init에 대해 이해했다 .
- 내 질문은 Normal vs Uniform init에 관한 것입니다.