«neural-network» 태그된 질문

인공 신경 네트워크 (ANN)는 생물학적 뉴런의 특성을 모방하는 프로그래밍 뉴런으로 구성된 '뉴런'으로 구성됩니다. 뉴런 사이의 가중 연결 세트는 네트워크 디자이너가 실제 시스템의 모델을 가지고 있지 않아도 인공 지능 문제를 해결하기 위해 정보가 네트워크를 통해 전파되도록합니다.

1
편견을 어떻게 초기화하고 정규화해야합니까?
나는 커널 초기화에 대한 몇 가지 논문을 읽었으며 많은 논문에서 커널의 L2 정규화를 사용한다고 언급합니다 (종종 ).λ=0.0001λ=0.0001\lambda = 0.0001 상수 0으로 바이어스를 초기화하고 정규화하지 않는 것과 다른 일이 있습니까? 커널 초기화 논문 Mishkin과 Matas : 필요한 것은 좋은 init입니다 Xavier Glorot 및 Yoshua Bengio : 심층 피드 포워드 신경망 훈련의 …


1
RNN (Recurrent Neural Network)에서 계층을 잊어 버림-
forget 레이어에서 RNN의 각 변수의 크기를 알아 내려고 노력하고 있지만 올바른 길을 가고 있는지 확실하지 않습니다. 다음 그림과 방정식은 Colah의 블로그 게시물 "LSTM 네트워크 이해"에 있습니다 . 어디: 는 크기 m의 입력 * 1 벡터엑스티xtx_tm ※ 1m∗1m*1 은 크기 n 의 숨겨진 상태입니다. * 1 벡터ht - 1ht−1h_{t-1}n ※ 1n∗1n*1 …

3
딥 러닝 NN과 현재 (2016)는 4 년 전에 공부 한 (NN)과 어떻게 다른가요?
Wikipedia 와 deeplearning4j 에서 DLNN ( Deep-Learning NN)은 숨겨진 계층이 1보다 큰 NN이라고합니다. 이러한 종류의 NN은 대학에서 표준 이었지만 DLNN은 매우 과장된 것입니다. 거기에 있었습니까? 큰 문제는 무엇입니까? 또한 스택 NN이 딥 러닝으로 간주된다고 들었습니다. 딥 러닝은 실제로 어떻게 정의됩니까? NN에 대한 나의 배경은 대부분 직업이 아닌 대학 출신입니다. 산업에서 …

2
Keras의 Early Stopping 콜백에서 사용하는 메트릭을 변경해야합니까?
Keras 교육에서 Early Stopping 콜백을 사용하는 경우 일부 메트릭 (일반적으로 유효성 검증 손실)이 증가하지 않으면 중지됩니다. 검증 손실 대신 다른 측정법 (정밀도, 리콜, f- 측정)을 사용하는 방법이 있습니까? 지금까지 본 모든 예제는 다음과 비슷합니다. 콜백 .EarlyStopping (monitor = 'val_loss', patience = 5, verbose = 0, mode = 'auto')

1
Keras의 멀티 태스킹 학습
Keras에서 공유 레이어를 구현하려고합니다. Keras에는 keras.layers.concatenate있지만, 사용에 대한 설명서는 확실하지 않습니다. 여러 개의 공유 레이어를 만드는 데 사용할 수 있습니까? Keras를 사용하여 아래에 표시된 것처럼 간단한 공유 신경 네트워크를 구현하는 가장 좋은 방법은 무엇입니까? 3 개의 NN에 대한 모든 입력, 출력 및 공유 레이어의 모양은 동일합니다. 세 개의 NN에는 여러 …

1
LSTM의 장점은 무엇입니까?
Keras 패키지에 대한 지식을 넓히고 있으며 사용 가능한 모델 중 일부를 툴링하고 있습니다. 해결하려는 NLP 이진 분류 문제가 있으며 다른 모델을 적용하고 있습니다. 일부 결과로 작업하고 LSTM에 대해 점점 더 많은 것을 읽은 후에는이 접근법이 내가 시도한 다른 것 (여러 데이터 세트에서)보다 훨씬 우수한 것처럼 보입니다. "왜 LSTM을 사용 하지 …


2
신경망이
유명한 Tensorflow Fizz Buzz 농담과 XOr 문제의 정신에서 y=x2y=x2y = x^2 기능 을 구현하는 신경망을 설계 할 수 있다면 생각하기 시작했습니다 . 숫자의 일부 표현 (예 : 이진수 형식의 벡터로 숫자 5가로 [1,0,1,0,0,0,0,...]표시됨) 이 주어진 경우 신경망은이 경우 제곱-25를 반환하는 법을 배워야합니다. y=x2y=x2y=x^2 구현할 수 있다면 아마도 y=x3y=x3y=x^3 및 일반적으로 …

3
신경망 설계에 대한 경험 규칙이 있습니까?
신경망 아키텍처는 대부분 문제 자체와 입력 / 출력 유형을 기반으로하지만 여전히 빌드를 시작할 때 항상 "사각형"이 있다는 것을 알고 있습니다. 그래서 내 질문은 MxN 의 입력 데이터 세트 (M은 레코드 수, N은 피처 수) 및 C 가능한 출력 클래스 가 주어진다 는 것입니다. 우리는 몇 개의 레이어 / 단위로 시작해야하는 …

4
모델이 과적 합을 시작한 것을 아는 방법은 무엇입니까?
다음 발췌문이 내 질문이 무엇인지에 대한 통찰력을 제공하기를 바랍니다. 이들은 http://neuralnetworksanddeeplearning.com/chap3.html 에서 온 것입니다. 학습은 점차 느려집니다. 마지막으로, 약 280 년경에 분류 정확도는 거의 개선되지 않습니다. 후기 신기원은 신기원 280에서 정확도 값 근처에서 작은 확률 론적 변동을 볼뿐입니다. 이전 데이터와 대조적으로 훈련 데이터와 관련된 비용이 계속해서 하락합니다. 우리가 그 비용을 …


2
불균일 간격 시계열 모델링
불규칙한 간격으로 1 년 동안 샘플링 된 연속 변수가 있습니다. 어떤 날에는 시간당 하나 이상의 관측치가 있지만 다른 기간에는 며칠 동안 아무것도 없습니다. 따라서 몇 달 (예 : 10 월)은 샘플링이 많고 다른 달은 샘플링되지 않기 때문에 시계열에서 패턴을 감지하기가 특히 어렵습니다. 내 질문은이 시계열을 모델링하는 가장 좋은 방법은 무엇입니까? …

1
몇 개의 LSTM 셀을 사용해야합니까?
사용해야하는 최소, 최대 및 "합리적인"양의 LSTM 셀과 관련된 경험 법칙 (또는 실제 규칙)이 있습니까? 특히 TensorFlow 및 속성의 BasicLSTMCell 과 관련이 num_units있습니다. 분류 문제가 다음과 같이 정의되었다고 가정하십시오. t - number of time steps n - length of input vector in each time step m - length of output vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.