나는 커널 초기화에 대한 몇 가지 논문을 읽었으며 많은 논문에서 커널의 L2 정규화를 사용한다고 언급합니다 (종종 ).
상수 0으로 바이어스를 초기화하고 정규화하지 않는 것과 다른 일이 있습니까?
커널 초기화 논문
- Mishkin과 Matas : 필요한 것은 좋은 init입니다
- Xavier Glorot 및 Yoshua Bengio : 심층 피드 포워드 신경망 훈련의 어려움 이해
- He et al : 정류기 심층 분석 : ImageNet 분류에서 인간 수준의 성능을 능가