사용해야하는 최소, 최대 및 "합리적인"양의 LSTM 셀과 관련된 경험 법칙 (또는 실제 규칙)이 있습니까? 특히 TensorFlow 및 속성의 BasicLSTMCell 과 관련이 num_units있습니다. 분류 문제가 다음과 같이 정의되었다고 가정하십시오. t - number of time steps n - length of input vector in each time step m - length of output vector …
응용 프로그램을 프로토 타이핑하고 있으며 생성 된 일부 문장의 난이도를 계산하려면 언어 모델이 필요합니다. 파이썬에서 쉽게 사용할 수있는 훈련 된 언어 모델이 있습니까? 간단한 것 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 일부 프레임 워크를 …
당신은 어떻게 할 최적화 사전에 훈련 된 neural network 별도의 문제에 적용 할 수 있습니까? 사전 훈련 된 모델 에 더 많은 레이어를 추가 하고 데이터 세트에서 테스트 하시겠습니까? 예를 들어, 작업이 CNN 을 사용하여 배경 화면 그룹 을 분류하는 경우 이미지 분류 기인 경우에도 이미지 고양이와 개에 대해 훈련 …
이 두 컨볼 루션 작업은 현재 딥 러닝에서 매우 일반적입니다. 이 논문에서 확장 된 컨볼 루션 레이어에 대해 읽었습니다. WAVENET : 원시 오디오를위한 일반적인 모델 그리고 De-convolution은이 논문에있다 : 시맨틱 세그먼테이션을위한 완전 컨볼 루션 네트워크 둘 다 이미지를 업 샘플링하는 것처럼 보이지만 차이점은 무엇입니까?
CNN (Convolutional Neural Network)을 사용하여 문서를 분류하려고합니다. 짧은 텍스트 / 문장에 대한 CNN은 많은 논문에서 연구되었습니다. 그러나 긴 텍스트 나 문서에 CNN을 사용한 논문은없는 것 같습니다. 내 문제는 문서의 기능이 너무 많다는 것입니다. 내 데이터 세트에서 각 문서에는 1000 개 이상의 토큰 / 단어가 있습니다. 각 예제를 CNN에 제공하기 위해 …
CNN에 필요한 가중치와 바이어스의 수를 파악하려고합니다. (3, 32, 32) 이미지가 있고 (32, 5, 5) 필터를 적용하고 싶다고 가정 해보십시오. 각 기능 맵마다 5x5 가중치가 있으므로 3 x (5x5) x 32 매개 변수가 있어야합니다. 이제 편견을 추가해야합니다. 나는 (3 x (5x5) + 1) x 32 매개 변수 만 가지고 있다고 생각하므로 …
내가 본 대부분의 네트워크에는 최종 softmax 레이어 이전에 하나 또는 두 개의 고밀도 레이어가 있습니다. 고밀도 레이어의 수와 크기를 선택하는 원칙적인 방법이 있습니까? 동일한 수의 매개 변수에 대해 두 개의 치밀한 레이어가 하나보다 더 대표적입니까? 각 고밀도 레이어 전에 드롭 아웃을 적용해야합니까, 아니면 한 번만 적용해야합니까?
EEG 컨텍스트에서 반복 아키텍처를 해석하는 방법이 궁금합니다. 특히 이것을 LSTM과 같은 아키텍처와 달리 Recurrent CNN이라고 생각하지만 다른 유형의 반복 네트워크에도 적용될 수 있습니다. R-CNN에 대해 읽으면 일반적으로 이미지 분류 컨텍스트에서 설명됩니다. 일반적으로 "시간에 따른 학습"또는 "현재 입력에 대한 시간 -1의 영향 포함"으로 설명됩니다. 이 해석 / 설명은 EEG 데이터로 작업 …
EEG 데이터를 분석하는 작업을하며 결국 분류해야합니다. 그러나, 기록을위한 라벨을 얻는 것은 다소 비싸서, 상당히 많은 양의 라벨링되지 않은 데이터를 더 잘 활용하기 위해 감독되지 않은 접근법을 고려하게되었습니다. 이것은 자연스럽게 쌓인 자동 엔코더를 고려하게하는 좋은 아이디어입니다. 그러나 어떤 종류의 필터링은 일반적으로 EEG에 매우 유용한 접근법이며, 고려 된 에포크 (epoch)는 전체적으로가 아니라 …
우리가 작업하고있는 프로젝트를 바탕으로 흥미로운 토론을했습니다. 왜 템플릿 매칭 알고리즘보다 CNN 육안 검사 시스템을 사용합니까? 배경 : 특정 유형의 물체가 "깨지거나"결함이 있는지 여부를 감지하는 간단한 CNN 비전 시스템 (웹캠 + 랩톱)의 데모를 보여주었습니다.이 경우에는 PCB 회로 보드입니다. 내 CNN 모델에는 정적 배경에서 적절하고 파손 된 회로 기판 (각각 약 100 …
나는 현재이 논문 의 결과를 재현하기 위해 노력하고있다 . 이 논문에서는 특징 추출을 위해 CNN을 사용하는 방법을 설명하고 Dnn-hmm이고 RBM을 사용하여 사전 훈련 된 음향 모델을 가지고 있습니다. 섹션 III 하위 섹션 A는 입력 데이터를 표현할 수있는 다른 방법을 설명합니다. 정적, 델타 및 델타 델타의 스펙트럼 플롯을 수직으로 쌓기로 결정했습니다. …
신경망에 대한 정규화 방법의 차이, 바람직하게는 다른 도메인 (또는 적어도 다른 데이터 세트)에 대한 차이점을 보여주는 논문이 있습니까? 나는 현재 대부분의 사람들이 컴퓨터 비전에서 정규화를 위해 드롭 아웃만을 사용하는 것처럼 보이기 때문에 묻고 있습니다. 다른 정규화 방법을 사용해야하는 이유가 있는지 확인하고 싶습니다.
나는 keras에서 모델을 훈련하려고 노력하고 있으며 ModelCheckpoint 를 사용하여 모니터링 된 유효성 검사 메트릭 (제 경우 Jaccard index ) 에 따라 최상의 모델을 저장하고 있습니다 . tensorboard에서 모델이 개선되는 것을 볼 수 있지만 가중치를로드하고 모델을 평가하려고 할 때 전혀 작동하지 않습니다. 또한 가중치를 저장 해야하는 파일의 타임 스탬프로 전혀 저장되지 …