«neural-networks» 태그된 질문

인공 신경망 (ANN)은 생물학적 신경망에 기반을 둔 광범위한 계산 모델입니다. 피드 포워드 NN ( "깊은"NN 포함), 컨볼 루션 NN, 반복 NN 등을 포함합니다.

1
ReLU 활성화가 SVM과 동일한 단일 계층 NeuralNetwork?
n 개의 입력과 단일 출력 (이진 분류 작업)이있는 간단한 단일 레이어 신경망이 있다고 가정합니다. 출력 노드에서 활성화 함수를 시그 모이 드 함수로 설정하면 결과는 로지스틱 회귀 분류기입니다. 이 시나리오에서 출력 활성화를 ReLU (정류 된 선형 단위)로 변경하면 결과 구조가 SVM과 같거나 비슷합니까? 왜 그렇지 않습니까?

1
간단한 퍼셉트론을 커널 화하는 방법?
비선형 경계의 분류 문제는 단순한 퍼셉트론 으로 해결할 수 없습니다 . 다음 R 코드는 설명을위한 것이며 Python 의이 예제 를 기반으로합니다 . nonlin <- function(x, deriv = F) { if (deriv) x*(1-x) else 1/(1+exp(-x)) } X <- matrix(c(-3,1, -2,1, -1,1, 0,1, 1,1, 2,1, 3,1), ncol=2, byrow=T) y <- c(0,0,1,1,1,0,0) syn0 …

2
사전 훈련이란 무엇이며 신경망을 어떻게 사전 훈련합니까?
사전 교육은 기존 교육의 일부 문제를 피하기 위해 사용됩니다. 자동 인코더와 함께 역 전파를 사용하면 역 전파가 느리고 시간이 오래 걸리고 현지 최적화에 얽매여 특정 기능을 배울 수 없기 때문에 시간 문제가 발생한다는 것을 알고 있습니다. 내가 이해하지 못하는 것은 네트워크를 사전 훈련시키는 방법과 사전 훈련을 위해 특별히하는 일입니다. 예를 …

1
CNN에서 컨볼 루션 연산자의 수를 결정하는 방법은 무엇입니까?
CNN (Convolutional Neural Networks)을 사용한 객체 분류와 같은 컴퓨터 비전 작업에서 네트워크는 매력적인 성능을 제공합니다. 그러나 컨볼 루션 레이어에서 매개 변수를 설정하는 방법을 잘 모르겠습니다. 예를 들어, 그레이 스케일 이미지 ( 480x480) 인 제 1 컨볼 루션 레이어는와 같은 컨벌루션 연산자를 사용할 수 있으며 11x11x10, 여기서 숫자 10 은 컨볼 …

4
신경망, auto.arima 및 ets를 사용한 R 시계열 예측
신경망을 사용하여 시계열을 예측하는 것에 대해 조금 들었습니다. 어떻게 시계열 (일일 소매 데이터)을 예측하는 방법이 더 좋은지 비교할 수 있습니다 : auto.arima (x), ets (x) 또는 nnetar (x). auto.arima와 AIC 또는 BIC의 ets를 비교할 수 있습니다. 그러나 어떻게 신경망과 비교할 수 있습니까? 예를 들면 다음과 같습니다. > dput(x) c(1774, 1706, …

1
생존 분석을위한 CPH, 가속 장애 시간 모델 또는 신경망 비교
나는 생존 분석에 익숙하지 않으며 최근에 특정 목표가 주어지면 그것을 수행하는 다른 방법이 있다는 것을 배웠습니다. 이러한 방법의 실제 구현 및 적절성에 관심이 있습니다. 나는 시간, 상태 및 기타 의료 데이터를 고려하여 환자의 생존을 얻는 방법으로 전통적인 콕스 비례 위험 , 가속 장애 시간 모델 및 신경망 (다층 퍼셉트론)을 제시했습니다. …

4
신경망 가중치의 수렴
500 번의 반복 후에도 신경망의 가중치가 수렴하지 않는 상황에 도달했습니다. 내 신경망에는 1 입력 레이어, 1 숨겨진 레이어 및 1 출력 레이어가 있습니다. 입력 레이어에는 약 230 개의 노드, 숨겨진 레이어에는 9 개의 노드, 출력 레이어에는 1 개의 출력 노드가 있습니다. 조기 정지 조건 (100 회 반복 후 신경망 훈련 …

2
로지스틱 함수로 변환 된 가우스 랜덤 변수의 예상 값
로지스틱 함수와 표준 편차는 일반적으로 로 표시 됩니다. 내가 사용합니다 및 표준 편차.σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss 내 말은 임의의 입력과 물류 신경이 과 표준 편차 내가 알고 있습니다. 평균과의 차이가 일부 가우시안 노이즈에 의해 대략적으로 추정 될 수 있기를 바랍니다. 따라서 약간의 표기법 남용으로 생성한다고 가정합니다 . 의 예상 값은 무엇입니까 …

2
AlphaZero 용지의 디리클레 노이즈의 목적
DeepMind의 AlphaGo Zero 및 AlphaZero 논문에서는 Monte Carlo Tree Search의 루트 노드 (보드 상태)의 사전 동작 확률에 Dirichlet 노이즈를 추가하는 방법에 대해 설명합니다 . 루트 노드 의 사전 확률에 Dirichlet 노이즈를 추가하여 추가 탐색을 수행합니다 . 특히 . 여기서 및 ; 이 소음으로 인해 모든 이동이 시도 될 수 있지만 …

3
입력이 조건부 독립적 일 때 하이퍼 플레인은 데이터를 최적으로 분류합니다. 왜 그렇습니까?
딥 러닝 ( Deep Learning) 및 정보 병목 현상 원칙 (Information Bottleneck Principle) 이라는 논문에서 저자는 섹션 II A)에서 다음과 같이 설명합니다. 단일 뉴런은 입력 공간 하이퍼 플레인 만 구현할 수 있으므로 선형으로 분리 가능한 입력 만 분류합니다 . 초평면은 입력이 조건에 맞지 않을 때 데이터를 최적으로 분류 할 수 …

2
WaveNet은 실제로 확장 된 회선이 아닙니다. 그렇지 않습니까?
최근 WaveNet 논문에서, 저자는 자신의 모델을 확장 된 회선의 층을 쌓은 것으로 언급합니다. 또한 '정규'컨벌루션과 확장 컨벌루션의 차이점을 설명하는 다음 차트를 생성합니다. 규칙적인 컨볼 루션은 다음과 같습니다. 이것은 필터 크기가 2이고 보폭이 1 인 컨볼 루션으로 4 개의 레이어에 대해 반복됩니다. 그런 다음 모델에서 사용하는 아키텍처를 보여줍니다.이를 확장 된 회선이라고합니다. …

1
SVM은 어떻게 템플릿 일치합니까?
SVM에 대해 읽고 최적화 문제를 해결하고 있으며 최대 마진 아이디어가 매우 합리적이라는 것을 알게되었습니다. 이제 커널을 사용하면 비선형 분리 경계까지도 찾을 수 있습니다. 지금까지 SVM (특수 커널 머신)과 커널 머신이 신경망과 어떤 관련이 있는지 전혀 모른다. Yann Lecun => 의 의견을 고려 하십시오 . kernel methods were a form of …

1
L2 정규화 기능이있는 RNN은 학습을 중지합니다
양방향 RNN을 사용하여 불균형 발생 이벤트를 감지합니다. 긍정적 클래스는 부정적인 클래스보다 100 배 적습니다. 정규화를 사용하지 않는 동안 기차 세트에서 100 % 정확도를 확인하고 유효성 검사 세트에서 30 %를 얻을 수 있습니다. 나는 l2 정규화를 켜고 결과는 학습 시간이 길지 않고 기차 세트에서 30 % 정확도이며 유효성 검사 세트에서 100 …

1
딥 러닝을위한 데이터가 얼마나됩니까?
딥 러닝 (특히 CNN)과 과적 합을 방지하기 위해 일반적으로 많은 양의 데이터가 필요한 방법에 대해 배우고 있습니다. 그러나 모델의 용량 / 용량이 많을수록 과적 합을 방지하기 위해 더 많은 데이터가 필요하다고 들었습니다. 따라서 내 질문은 : 심층 신경망에서 레이어 당 레이어 / 노드 수를 줄이고 왜 적은 양의 데이터로 작동하게 …

3
반복 신경망의 구조 (LSTM, GRU)
RNN의 아키텍처를 이해하려고합니다. 나는 매우 도움이되는이 튜토리얼을 찾았습니다 : http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 특히이 이미지 : 이것이 피드 포워드 네트워크에 어떻게 맞습니까? 이 이미지는 각 레이어의 다른 노드입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.