이제 신경망이 패턴을 인식하고 입력을 분류하기 위해 어떻게 작동하는지 배우기 시작했으며 인공 신경망이 이미지 데이터를 구문 분석하고 이미지를 분류하는 방법 ( convnetjs 데모 )과 그 핵심 을 살펴 보았습니다. 이미지를 다운 샘플링하고 각 픽셀이 하나의 입력 뉴런을 네트워크로 자극합니다.
그러나 문자열 입력으로 가능하다면 머리를 감싸려고합니까? 내가 가진 유스 케이스는 사용자가 본 영화의 "권장 엔진"입니다. 영화에는 많은 문자열 데이터 (제목, 줄거리, 태그)가 있으며 텍스트를 해당 영화를 설명하는 몇 가지 핵심 단어로 "다운 샘플링"한다고 상상할 수 있지만이 영화를 설명하는 상위 5 개 단어를 파싱하더라도 영화 세트를 비교하려면 모든 영어 단어에 입력 뉴런이 필요하다고 생각하십니까? 입력 뉴런을 세트에 사용 된 단어로만 제한 할 수 있지만 새로운 영화 (사용자가 새로운 영화와 함께 새로운 단어를보고)를 추가하여 성장 / 학습 할 수 있습니까? 내가 본 대부분의 라이브러리는 시스템이 훈련 된 후에 새로운 뉴런을 추가 할 수 없습니까?
문자열 / 단어 / 문자 데이터를 입력에 신경망으로 매핑하는 표준 방법이 있습니까? 아니면 신경망이 실제로 문자열 데이터를 파싱하는 작업에 적합한 도구가 아닌가?