저는 딥 러닝을 처음 접했고 특히 LSTM과 BiLSTM가 무엇이며 언제 사용해야하는지 (주요 응용 분야) 알고 싶습니다. LSTM 및 BILSTM가 RNN보다 인기가 높은 이유는 무엇입니까?
감독되지 않은 문제에서 이러한 딥 러닝 아키텍처를 사용할 수 있습니까?
저는 딥 러닝을 처음 접했고 특히 LSTM과 BiLSTM가 무엇이며 언제 사용해야하는지 (주요 응용 분야) 알고 싶습니다. LSTM 및 BILSTM가 RNN보다 인기가 높은 이유는 무엇입니까?
감독되지 않은 문제에서 이러한 딥 러닝 아키텍처를 사용할 수 있습니까?
답변:
RNN
학습 문제가 순차적 인 경우 LSTM
와 같은 아키텍처 BiLSTM
에서 사용됩니다. 예를 들어, 비디오가 있고 모든 것이 무엇인지 알고 싶거나 에이전트가 텍스트 이미지 인 문서를 읽도록합니다. 텍스트 형식이 아닙니다. 나는 당신이 여기를 볼 것을 적극 권장합니다 .
LSTMs
그들의 양방향 변형은 아키텍처에서 게이트를 언제 어떻게 잊어야하는지, 언제 잊어야하는지 배우려고했기 때문에 인기가 있습니다. 이전 RNN
아키텍처에서는 소실 그라디언트가 큰 문제였으며 이러한 네트는 그다지 배우지 못했습니다.
Bidirectional을 사용 LSTMs
하면 학습 알고리즘에 원본 데이터를 처음부터 끝까지 한 번, 끝까지 처음으로 한 번 제공합니다. 여기에는 토론이 있지만 작업에 따라 다르지만 일반적으로 단방향 접근 방식보다 빠르게 학습합니다.
인간은 매 순간 처음부터 생각을 시작하지 않습니다. 이 에세이를 읽으면서 이전 단어에 대한 이해를 바탕으로 각 단어를 이해합니다. 모든 것을 버리지 않고 처음부터 다시 생각하기 시작합니다. 당신의 생각에는 끈기가 있습니다.
전통적인 신경망은 이것을 할 수 없으며 주요 단점처럼 보입니다. 예를 들어, 영화의 모든 지점에서 어떤 종류의 이벤트가 발생하고 있는지 분류하려고한다고 가정하십시오. 전통적인 신경망이 어떻게 영화의 이전 사건에 대한 추론을 사용하여 후자의 사건에 정보를 제공 할 수 있는지는 확실하지 않습니다.
반복 신경망이이 문제를 해결합니다. 루프가있는 네트워크이므로 정보를 유지할 수 있습니다.
자세한 내용은 Cohen의 블로그를 참조하십시오.
LSTM과 비교 BLSTM
하거나 BiLSTM
두 개의 네트워크가 있는데, 하나 past
는 forward
방향으로 액세스 정보 이고 다른 하나 는 방향으로 액세스 future
합니다 reverse
. 위키
여기에Bidirectional
공식 문서에 따라 새로운 수업 이 추가됩니다 .
model = Sequential()
model.add(Bidirectional(LSTM(num_channels,
implementation = 2, recurrent_activation = 'sigmoid'),
input_shape=(input_length, input_dim)))