반복 신경망을 어떻게 서열 분류에 사용할 수 있습니까?


19

RNN은 예측 또는 시퀀스 대 시퀀스 매핑에 사용될 수 있습니다. 그러나 RNN을 어떻게 분류에 사용할 수 있습니까? 우리는 전체 시퀀스에 하나의 레이블을 부여합니다.


이전 용어를 사용하여 다음 용어를 예측하려고합니다. 그런 다음 해당 네트워크의 입력을 계열의 예측 오류이고 출력이 클래스 레이블 인 방사형 기준 함수 (3 * classlabelcount 또는 가우스 pdf 뉴런)에 추가합니다. 입력 레이어에 적절한 수의 뉴런이 있습니다-분류하는 데 필요한 요소 수를 설명하기에 충분합니다. 이것은 단지 나의 개인적인 접근입니다.
EngrStudent-복직 모니카

답변:


13

이 그림 ( source )이 보여주는 것처럼 RNN을 사용하여 여러 입력을 단일 입력 (라벨)에 매핑 할 수 있습니다 .

여기에 이미지 설명을 입력하십시오

각 사각형은 벡터이며 화살표는 함수를 나타냅니다 (예 : 행렬 곱하기). 입력 벡터는 빨간색, 출력 벡터는 파란색 및 녹색 벡터는 RNN의 상태를 유지합니다 (더 자세한 내용은 곧 설명). 왼쪽에서 오른쪽으로 : (1) 고정 크기 입력에서 고정 크기 출력 (예 : 이미지 분류)에 이르기까지 RNN이없는 바닐라 처리 모드. (2) 시퀀스 출력 (예 : 이미지 캡션은 이미지를 가져와 단어 문장을 출력합니다). (3) 시퀀스 입력 (예 : 주어진 문장이 긍정적 또는 부정적 감정을 표현하는 것으로 분류되는 감정 분석). (4) 시퀀스 입력 및 시퀀스 출력 (예 : 기계 번역 : RNN은 영어로 문장을 읽은 다음 프랑스어로 문장을 출력합니다). (5) 동기화 된 시퀀스 입력 및 출력 (예 : 비디오의 각 프레임에 레이블을 지정하려는 비디오 분류).


4

간단한 RNN의 경우 전체 시퀀스를 네트워크에 공급 한 다음 마지막 시퀀스 요소에서 클래스 레이블을 출력하십시오 ( 이 백서 및이 방법의 초기 예는 여기 참조). 훈련 단계에서 마지막 시퀀스 요소부터 시퀀스 시작까지 시간에 따른 오류를 백프로 포지션 할 수 있습니다. 일반적으로 이는 시퀀스의 일부 요소에만 레이블을 할당해야하는 RNN 시퀀스 레이블 문제와 다르지 않습니다 (또는 다른 모든 요소는 OTHER로 레이블이 지정됨).


더 긴 시퀀스에는주의를 기울여야합니다. 시퀀스 시작 정보는 시퀀스 정보에 압도 될 수 있습니다.
Vladislavs Dovgalecs
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.