1
훈련 신경망에 매우 작거나 NaN 값이 나타납니다.
Haskell에서 신경망 아키텍처를 구현하고 MNIST에서 사용하려고합니다. hmatrix선형 대수 패키지를 사용하고 있습니다. 내 교육 프레임 워크는 pipes패키지를 사용하여 빌드 됩니다. 내 코드가 컴파일되고 충돌하지 않습니다. 그러나 문제는 레이어 크기 (예 : 1000), 미니 배치 크기 및 학습률의 특정 조합 NaN이 계산 값을 생성한다는 것입니다. 몇 가지 검사 후 극히 작은 값 …