배치 정규화 (BN) 용지를 읽고 있었으며 (1) 모형의 정확성을 추적하기 위해 이동 평균을 사용해야하는 필요성을 이해하지 못했으며, 그것이 옳은 일임을 인정하더라도 이해가되지 않습니다. 그들이 정확히하고있는 일.
내 이해 (내 잘못)를 위해, 논문은 모델이 훈련을 마치면 미니 배치 통계보다는 인구 통계를 사용한다고 언급합니다. 편견없는 추정치에 대한 논의를 마치면 (나에게 중요한 것처럼 보이며 왜 그것에 대해 이야기하는지 이해하지 못합니다) 그들은 다음과 같이 말합니다.
대신 이동 평균을 사용하여 훈련 할 때 모델의 정확도를 추적합니다.
그것이 저에게 혼란스러운 부분입니다. 모델의 정확도와 어떤 데이터 세트를 추정하기 위해 이동 평균을 사용합니까?
일반적으로 사람들이 모델의 일반화를 추정하기 위해 수행하는 작업은 모델의 유효성 검사 오류를 추적하고 잠재적으로 조기에 그라데이션 하강을 중지하여 정규화합니다. 그러나 배치 정규화가 완전히 다른 일을하고있는 것 같습니다. 누군가가 무엇을, 왜 다른 일을하는지 명확히 할 수 있습니까?
1 : Ioffe S. and Szegedy C. (2015),
"일괄 정규화 : 내부 공변량 변화를 줄임으로써 딥 네트워크 교육 가속화",
제 32 회 기계 학습에 관한 국제 회의 , 릴, 프랑스, 2015.
머신 러닝 연구 저널 : W & CP 볼륨 37