사용해야하는 최소, 최대 및 "합리적인"양의 LSTM 셀과 관련된 경험 법칙 (또는 실제 규칙)이 있습니까? 특히 TensorFlow 및 속성의 BasicLSTMCell 과 관련이 num_units
있습니다.
분류 문제가 다음과 같이 정의되었다고 가정하십시오.
t - number of time steps
n - length of input vector in each time step
m - length of output vector (number of classes)
i - number of training examples
예를 들어, 훈련 예제 수가 다음보다 커야한다는 것이 사실입니까?
4*((n+1)*m + m*m)*c
c
세포의 수는 어디에 있습니까? 나는 이것을 이것을 기반으로 : LSTM 네트워크의 매개 변수 수를 계산하는 방법? 내가 이해하는 것처럼, 이것은 총 매개 변수 수를 제공해야하며 이는 훈련 예제 수보다 적어야합니다.
1
하이퍼 파라미터 튜닝뿐만 아니라 순차적 딥 러닝 모델을 비교하는 주제를 훌륭하게 다루는이 백서를 확인 하겠습니다 . 레이어는 성능을 향상 시키지만 수익이 감소하고 교육 시간이 늘어납니다.
—
CubeBot88 2016 년