«neural-networks» 태그된 질문

인공 신경망 (ANN)은 생물학적 신경망에 기반을 둔 광범위한 계산 모델입니다. 피드 포워드 NN ( "깊은"NN 포함), 컨볼 루션 NN, 반복 NN 등을 포함합니다.

1
자동 인코더에서 ReLU를 활성화 기능으로 사용할 수 있습니까?
신경망으로 오토 인코더를 구현할 때 대부분의 사람들은 활성화 기능으로 시그 모이 드를 사용합니다. 대신 ReLU를 사용할 수 있습니까? ReLU에는 상한에 대한 제한이 없으므로 기본적으로 시그 모이 드를 사용할 때 자동 인코더에 대한 제한된 기준과 달리 입력 이미지의 픽셀 수가 1보다 클 수 있습니다.

2
연속 단어 모음에 대한 질문
이 문장을 이해하는 데 문제가 있습니다. 제안 된 첫 번째 아키텍처는 피드 포워드 NNLM과 유사합니다. 여기서 비선형 히든 레이어가 제거되고 프로젝션 레이어는 프로젝션 매트릭스뿐만 아니라 모든 단어에 대해 공유됩니다. 따라서 모든 단어가 같은 위치에 투영됩니다 (그들의 벡터는 평균화됩니다). 프로젝션 레이어와 프로젝션 매트릭스는 무엇입니까? 모든 단어가 같은 위치에 투사된다는 것은 무슨 …

1
컨볼 루션 신경망 교육
현재 컨볼 루션 신경망을 사용하여 얼굴을 인식하는 얼굴 인식 소프트웨어를 개발 중입니다. 나의 독서에 기초하여, 나는 컨볼 루션 신경망이 가중치를 공유하여 훈련하는 동안 시간을 ​​절약 할 수 있다는 것을 모았다. 그러나 어떻게 역 전파 (backpropagation)를 조정하여 컨볼 루션 신경망에서 사용될 수 있습니까? 역 전파에서, 이와 유사한 공식을 사용하여 가중치를 훈련시킵니다. …

2
퍼셉트론에 대한 결정 경계 플롯
퍼셉트론 알고리즘의 결정 경계를 플롯하려고하는데 실제로 몇 가지 사항에 대해 혼란스러워합니다. 내 입력 인스턴스는 이며 기본적으로 2D 입력 인스턴스 ( x 1 및 x 2 ) 및 이진 클래스 대상 값 ( y ) [1 또는 0]입니다.[(x1,x2),y][(x1,x2),y][(x_{1},x_{2}), y]x1x1x_{1}x2x2x_{2}yyy 내 가중치 벡터는 입니다.[w1,w2][w1,w2][w_{1}, w_{2}] 이제 추가 바이어스 매개 변수 을 통합해야 …

2
신경망의 VC 치수 계산
나는와 시그 모이 뉴런의 일부 고정이 아닌 재발 (DAG) 토폴로지 (노드와 가장자리의 고정 세트하지만, 학습 알고리즘은 가장자리에 무게를 다를 수 있음)이있는 경우 단지에서 문자열을 할 수있는 입력 뉴런 { - 1 , 1 } n 을 입력으로하여 하나의 출력으로 이어집니다 (실제 값은 0에서 멀어지고 특정 고정 임계 값 인 경우 …

2
신경망 안정성을 개선하려면 어떻게합니까?
R의 신경망을 사용하여 14 개의 입력과 하나의 출력으로 NN을 구축하고 있습니다. 동일한 입력 교육 데이터와 동일한 네트워크 아키텍처 / 설정을 사용하여 네트워크를 여러 번 빌드 / 트레이닝합니다. 각 네트워크가 생성 된 후 독립 테스트 데이터 세트에서이를 사용하여 일부 예측 값을 계산합니다. 네트워크를 구축 할 때마다 모든 입력 (훈련 데이터 및 …

4
왜 하이퍼 파라미터를 배우지 않습니까?
나는 매우 인기있는 논문 인 " EXLAINING AND HARNESSING ADVERSARIAL EXAMPLES "를 구현하고 있었고 논문에서 적대적인 목적 함수를 훈련시켰다. J ''(θ) = αJ (θ) + (1-α) J '(θ). α를 하이퍼 파라미터로 취급합니다. α는 0.1, 0.2, 0.3 등이 될 수 있습니다. 이 특정 논문에 관계없이 α를 매개 변수에 포함시키고 최고의 α를 …

2
컨볼 루션 레이어의 여러 필터가 훈련 중에 동일한 매개 변수를 배우지 않습니까?
내가 배운 내용을 바탕으로 CNN의 Conv Layer에서 여러 필터를 사용하여 다양한 기능 탐지기를 학습합니다. 그러나 이러한 필터는 비슷하게 적용되므로 (즉, 입력 영역에 슬라이드 및 곱하기) 훈련 중에 동일한 매개 변수를 배우지 않습니까? 따라서 여러 필터를 사용하는 것이 중복됩니까?

3
CIFAR-10 Tensorflow 백엔드가있는 Keras가 60 % 이상의 정확도를 달성 할 수 없음
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . CIFAR-10 데이터 세트에서 15 에포크 이후 훈련은 유효성 검사 손실이 더 이상 감소하지 않는 것으로 보이며 1.4 (60 % 유효성 검사 정확도)로 고정됩니다. …

2
컨볼 루션 신경망이 다른 크기의 입력 이미지로 사용할 수 있습니까?
이미지 인식을 위해 컨볼 루션 네트워크를 만들고 있는데 크기가 다른 이미지를 입력 할 수 있는지 궁금합니다. 이 프로젝트에서 : https://github.com/harvardnlp/im2markup 그들은 말합니다 : and group images of similar sizes to facilitate batching 따라서 전처리 후에도 이미지의 크기는 여전히 다르므로 수식의 일부를 잘라 내지 않기 때문에 의미가 있습니다. 다른 크기를 사용하는 …



2
그래픽 모델과 Boltzmann 기계는 수학적으로 관련이 있습니까?
물리 클래스에서 Boltzmann 기계로 실제로 프로그래밍을 수행했지만 이론적 특성에 익숙하지 않습니다. 대조적으로, 나는 그래픽 모델 이론 (Lauritzen 's Book Graphical Models 의 처음 몇 장에 관한)에 대해 적당히 알고있다 . 질문 : 그래픽 모델과 Boltzmann 머신간에 의미있는 관계가 있습니까? Boltzmann 기계는 그래픽 모델 유형입니까? 분명히 볼츠만 기계는 신경망의 한 유형입니다. …

3
신경망을 훈련시켜 특정 스타일로 그림을 그릴 수 있습니까?
신경망을 훈련시켜 특정 스타일로 그림을 그릴 수 있습니까? (따라서 이미지를 가져와 훈련 된 스타일로 다시 그립니다.) 그런 종류의 물건에 대해 승인 된 기술이 있습니까? DeepArt 알고리즘에 대해 알고 있습니다. 기본 이미지를 특정 패턴 (예 : vangoghify 이미지)으로 채우는 것이 좋지만, 입력 초상화에서 특정 스타일로 만화를 만드는 것과 같은 다른 것을 …

1
신경망은 일반적으로 훈련 중에“킥 인”하는 데 시간이 걸립니까?
역 전파를 사용하여 분류를 위해 심층 신경망을 훈련하려고합니다. 특히, Tensor Flow 라이브러리를 사용하여 이미지 분류에 회선 신경망을 사용하고 있습니다. 훈련하는 동안 이상한 행동을 겪고 있으며 이것이 전형적인 것인지 또는 내가 잘못하고 있는지 궁금합니다. 그래서 내 컨볼 루션 신경망에는 8 개의 레이어 (5 컨볼 루션, 3 개의 완전히 연결된)가 있습니다. 모든 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.