Keras 패키지에 대한 지식을 넓히고 있으며 사용 가능한 모델 중 일부를 툴링하고 있습니다. 해결하려는 NLP 이진 분류 문제가 있으며 다른 모델을 적용하고 있습니다.
일부 결과로 작업하고 LSTM에 대해 점점 더 많은 것을 읽은 후에는이 접근법이 내가 시도한 다른 것 (여러 데이터 세트에서)보다 훨씬 우수한 것처럼 보입니다. "왜 LSTM을 사용 하지 않겠습니까?" 라고 계속 생각합니다 . LSTM 고유의 추가 게이트를 사용하면 사라지는 그라디언트를 겪는 일부 모델을 사용한 후 나에게 완벽하게 이해됩니다.
LSTM의 장점은 무엇입니까? 그들은 어디에서 그렇게 잘하지 않습니까? "모두에 맞는"알고리즘이 없다는 것을 알고 있으므로 LSTM의 단점이 있어야합니다.
GRU를 사용해보십시오. LSTM과 비슷하지만 적은 메모리가 필요하고 더 빨리 훈련합니다.
—
Vivek Khetan