나는 theano를 사용하여 LSTM을 실험 해 왔으며 LSTM에 가장 적합한 최적화 방법 (SGD, Adagrad, Adadelta, RMSprop, Adam 등)이 궁금하십니까? 이 주제에 관한 연구 논문이 있습니까?
또한 대답은 LSTM을 사용하는 응용 프로그램 유형에 따라 달라 집니까? 그렇다면 텍스트 분류를 위해 LSTM을 사용하고 있습니다 (텍스트는 먼저 단어 벡터로 변환됩니다).
마지막으로, RNN에 대한 답이 같거나 다를까요? 연구 논문이나 개인적인 통찰력에 대한 조언은 높이 평가 될 것입니다!
LSTM은 매우 강력 해 보이며이를 가장 잘 사용하는 방법에 대해 더 많이 배우고 싶습니다.