«neural-networks» 태그된 질문

인공 신경망 (ANN)은 생물학적 신경망에 기반을 둔 광범위한 계산 모델입니다. 피드 포워드 NN ( "깊은"NN 포함), 컨볼 루션 NN, 반복 NN 등을 포함합니다.

4
피드백 RNN과 LSTM / GRU의 차이점
시계열 데이터에 적용 할 다른 RNN (Recurrent Neural Network) 아키텍처를 이해하려고하는데 RNN을 설명 할 때 자주 사용되는 다른 이름과 약간 혼동되고 있습니다. LSTM (Long Shortterm Memory) 및 GRU (Gated Recurrent Unit)의 구조는 본질적으로 피드백 루프가있는 RNN입니까?

2
신경망에서 왜 다른 메타 휴리스틱보다 그라데이션 방법을 사용합니까?
깊고 얕은 신경망을 훈련 할 때 왜 다른 메타 휴리스틱 스와 달리 그래디언트 방법 (예 : 그래디언트 디센트, 네 스테 로프, 뉴턴-라프 슨)이 일반적으로 사용됩니까? 메타 휴리스틱 스 (metaheuristics) 란 로컬 소소한 상황에 빠지지 않도록 개발 된 시뮬레이션 어닐링, 개미 식민지 최적화 등과 같은 방법을 의미합니다.

2
LSTM에 가장 적합한 최적화 방법은 무엇입니까?
나는 theano를 사용하여 LSTM을 실험 해 왔으며 LSTM에 가장 적합한 최적화 방법 (SGD, Adagrad, Adadelta, RMSprop, Adam 등)이 궁금하십니까? 이 주제에 관한 연구 논문이 있습니까? 또한 대답은 LSTM을 사용하는 응용 프로그램 유형에 따라 달라 집니까? 그렇다면 텍스트 분류를 위해 LSTM을 사용하고 있습니다 (텍스트는 먼저 단어 벡터로 변환됩니다). 마지막으로, RNN에 대한 …


5
딥 러닝 : 어떤 변수가 중요한지 어떻게 알 수 있습니까?
신경망 용어 (y = Weight * x + bias)와 관련하여 어떤 변수가 다른 변수보다 더 중요한지 어떻게 알 수 있습니까? 10 개의 입력, 20 개의 노드가있는 1 개의 숨겨진 레이어 및 1 개의 노드가있는 1 개의 출력 레이어가있는 신경망이 있습니다. 어떤 입력 변수가 다른 변수보다 더 영향력이 있는지 아는 방법을 …

4
CNN을 사용하여 1D 신호를 분류하는 것이 좋습니다?
수면 단계 분류 작업을하고 있습니다. 나는이 주제에 관한 몇몇 연구 기사를 읽었으며 그 중 많은 것들이 SVM 또는 앙상블 방법을 사용했습니다. 1 차원 EEG 신호를 분류하기 위해 회선 신경망을 사용하는 것이 좋은 생각입니까? 나는 이런 종류의 일에 처음이다. 내가 잘못 물어 보면 용서해주세요

3
시계열 벡터 예측을 위해 RNN (LSTM) 사용 (Theano)
나는 매우 간단한 문제가 있지만 그것을 해결할 수있는 올바른 도구를 찾을 수 없습니다. 길이가 같은 벡터 시퀀스가 ​​있습니다. 이제이 시퀀스의 기차 샘플에 대해 LSTM RNN을 학습 한 다음 여러 프라이밍 벡터를 기반으로 길이 의 새로운 벡터 시퀀스를 예측하려고합니다 .엔엔n 이 작업을 수행하는 간단한 구현을 찾을 수 없습니다. 내 기본 언어는 …

3
신경망에서 바이어스 노드의 중요성
바이어스 노드가 현대 신경 네트워크의 효과에 얼마나 중요한지 알고 싶습니다. 입력 변수가 적은 얕은 네트워크에서 중요 할 수 있음을 쉽게 이해할 수 있습니다. 그러나 딥 러닝과 같은 현대 신경망에는 종종 특정 뉴런이 트리거되는지 여부를 결정하기 위해 많은 입력 변수가 있습니다. 예를 들어 LeNet5 또는 ImageNet에서 단순히 제거하면 실제 영향이 있습니까?



5
SVM 또는 신경망을 사용할 때 범주 형 변수를 숫자 형 변수로 코딩하는 방법
SVM 또는 신경망을 사용하려면 범주 형 변수를 숫자 변수로 변환 (인코딩)해야합니다.이 경우 일반적인 방법은 0-1 이진 값을 사용하여 k 번째 범주 형 값을 (0,0, .. ., 1,0, ... 0) (1은 k 번째 위치에 있습니다). 0-1 표현이 신경망에 많은 수의 추가 차원 (입력 단위)을 도입하여 특히 바람직하지 않거나 예상하지 않은 것처럼 …

2
블랙 박스로서 신경망의 의미?
나는 사람들이 신경망에 대해 블랙 박스와 같은 것을 말하는 것을 종종 듣습니다. 나는 그들이 의미하는 바를 이해할 수 없습니다! 역 전파 작동 방식을 이해하면 어떻게 블랙 박스입니까? 그들은 우리가 어떻게 무게를 계산했는지 또는 무엇을 이해하지 못한다는 것을 의미합니까?

2
역 전파 알고리즘
다층 퍼셉트론 (MLP)에 사용 된 역 전파 알고리즘 에 약간의 혼동이 있었습니다. 비용 함수에 의해 오류가 조정됩니다. 역 전파에서 숨겨진 레이어의 가중치를 조정하려고합니다. 이해할 수있는 출력 오류, 즉 e = d - y[첨자없이]입니다. 질문은 : 숨겨진 레이어의 오류는 어떻게 얻습니까? 어떻게 계산합니까? 역 전파하는 경우 적응 필터의 비용 ​​함수로 사용해야합니까, …

1
신경망에서 최적의 주간 기능 구성
회귀 문제를 다루면서 "요일"기능의 표현에 대해 생각하기 시작했습니다. 어떤 접근 방식이 더 나은지 궁금합니다. 하나의 특징; 월요일의 1/7 값; 화요일 2/7 ... 7 가지 특징 : 월요일의 (1, 0, 0, 0, 0, 0, 0); 화요일의 경우 (0, 1, 0, 0, 0, 0, 0) ... 네트워크 구성 차이로 인해 측정하기가 어렵습니다. …

3
신경망은 함수 또는 확률 밀도 함수를 학습합니까?
통계적 추론과 신경망에 익숙하지 않기 때문에 질문이 조금 이상하게 들릴 수 있습니다. 신경망을 사용하는 분류 문제 에서 입력 x 의 공간을 출력 y 의 공간에 매핑 하는 함수 를 배우고 싶다고 말합니다 .f∗f∗f^*xxxyyy f∗(x;θ)=yf∗(x;θ)=yf^*(x; \theta) = y 비선형 함수를 모델링하거나 확률 밀도 함수를 모델링하기 위해 모수 ( θθ\theta )를 피팅하고 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.