사전 교육은 기존 교육의 일부 문제를 피하기 위해 사용됩니다. 자동 인코더와 함께 역 전파를 사용하면 역 전파가 느리고 시간이 오래 걸리고 현지 최적화에 얽매여 특정 기능을 배울 수 없기 때문에 시간 문제가 발생한다는 것을 알고 있습니다.
내가 이해하지 못하는 것은 네트워크를 사전 훈련시키는 방법과 사전 훈련을 위해 특별히하는 일입니다. 예를 들어 제한된 Boltzmann Machines 스택이 제공되는 경우이 네트워크를 어떻게 사전 교육합니까?
2
레이블이 지정되지 않은 샘플이 많고 레이블이 지정되지 않은 샘플이 많은 설정이 아닌 경우 사전 훈련은 더 이상 사용되지 않는 것으로 간주됩니다. 그렇지 않은 경우 정류기 전송 함수 및 고급 최적화 기능 (rmsprop, adadelta, adam)을 사용하면 심층 신경망에 대해 동일하게 작동합니다.
—
bayerj
예, 레이블이없는 샘플이 많고 레이블이없는 샘플이 거의 없다고 가정하고 있습니다.
—
Michael Yousef