“LSTM 셀의 단위 수”의 의미는 무엇입니까?


19

Tensorflow 코드에서 : Tensorflow. RnnCell.

num_units: int, The number of units in the LSTM cell.

이것이 무엇을 의미하는지 이해할 수 없습니다. LSTM 셀의 단위는 무엇입니까? 입력, 출력 및 게이트를 잊습니까? 이것은 "Deep LSTM에 대한 반복 투영 레이어의 단위 수"를 의미합니다. 그렇다면 왜 이것을 "LSTM 셀의 유닛 수"라고합니까? LSTM 셀이란 무엇이고 차이점 VS LSTM 블록은 무엇입니까? 셀이 아닌 경우 최소 LSTM 단위는 무엇입니까?



레이어에 여러 개의 병렬 LSTM 장치가 포함 된 경우 입력 x를 어떻게 처리합니까? 사례 1 : h (1) = f (x) h (t) = f (h (t-1), x) h (t + 1) = f (h (t), x) 사례 2 : h (1 ) = f (x) h (t) = h (t-1) ResNet과 같은 다른 경우가있을 수 있습니다.
user1908842

답변:


10

이 기능에서 유용한 의견이 말하듯이

이 패키지의 셀 정의는 문헌에 사용 된 정의와 다릅니다. 문헌에서 셀은 단일 스칼라 출력을 가진 객체를 말합니다. 이 패키지의 정의는 이러한 단위의 수평 배열을 나타냅니다.

본질적으로, 층은 구조적으로 동일하지만 각각 서로 다른 것을 "기억하는"여러 개의 병렬 LSTM 장치를 포함 할 것입니다.


1
Thanks :)이 의견은 7 일 전에이 질문에 추가되었습니다. 일부 나는 그들이 LSTM 셀의 정의는 문학 LSTM 세포와 다릅니다 .. 그들이 :) 의견 것을 추가 한 이유는 구글 그룹에 Tensorflow 팀을 요구했다 파고 후
밀기울 DS에

6

대부분의 LSTM / RNN 다이어그램은 숨겨진 셀만 표시하지만 해당 셀의 단위는 표시하지 않습니다. 따라서 혼란. 각 숨겨진 레이어에는 시간 단계 수만큼 숨겨진 셀이 있습니다. 또한 각 숨겨진 셀은 아래 다이어그램과 같이 여러 개의 숨겨진 단위로 구성됩니다. 따라서 RNN에서 숨겨진 계층 매트릭스의 차원은 (시간 단계 수, 숨겨진 단위 수)입니다.

여기에 이미지 설명을 입력하십시오


1

TensorFlow 또는 Theano 위에있는 Keras에서을 호출 model.add(LSTM(num_units))하면 num_units는 출력 공간의 차원입니다 ( 여기서는 863 행). 저 num_units에게 이것은 다음 활성화 단계로 활성화 된 숨겨진 유닛의 수입니다.


0

RNN의 유닛 수는 서로 수직으로 연결된 시퀀스의 각 입력에 대한 RNN 메모리 유닛의 수이며, 각각은 필터링 된 정보를 다음 메모리 유닛으로 전달하고있다.

이 개념은 비트 단위의 다른 단위로의 메모리 할당 흐름의 컴퓨터 과학 개념에서 영감을 얻은 것임을 기억하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.