«neural-networks» 태그된 질문

인공 신경망 (ANN)은 생물학적 신경망에 기반을 둔 광범위한 계산 모델입니다. 피드 포워드 NN ( "깊은"NN 포함), 컨볼 루션 NN, 반복 NN 등을 포함합니다.

2
신경망 : 이진 분류의 경우 1 개 또는 2 개의 출력 뉴런을 사용합니까?
이진 분류를 수행하고 싶다고 가정합니다 (뭔가 클래스 A 또는 클래스 B에 속함). 신경망의 출력 레이어에서이를 수행 할 수있는 몇 가지 가능성이 있습니다. 1 개의 출력 노드를 사용하십시오. 출력 0 (<0.5)은 클래스 A로 간주되고 1 (> = 0.5)은 클래스 B로 간주됩니다 (시그 모이 드의 경우). 2 개의 출력 노드를 사용하십시오. 입력은 …

1
훈련 손실이 점점 줄어 듭니다. 무슨 일이야?
훈련 손실이 줄어들었다가 다시 증가합니다. 매우 이상합니다. 교차 검증 손실은 훈련 손실을 추적합니다. 무슨 일이야? Keras에서 다음과 같이 두 개의 스택 LSTMS가 있습니다. model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') 나는 100 Epochs를 위해 그것을 훈련시킵니다. model.fit(X_train, np.array(y_train), batch_size=1024, nb_epoch=100, validation_split=0.2) 127803 …

4
스킵 레이어 연결을 가진 신경망
신경망과의 회귀에 관심이 있습니다. 숨겨진 노드 + 스킵 레이어 연결이없는 신경망은 선형 모델입니다. 같은 신경망이지만 숨겨진 노드는 어떻습니까? 스킵 레이어 연결의 역할이 무엇인지 궁금합니다. 직관적으로, 스킵 레이어 연결을 포함하면 최종 모델은 선형 모델 + 일부 비선형 부품의 합입니다. 신경망에 스킵 레이어 연결을 추가 할 때 장점이나 단점이 있습니까?


8
머신 러닝에 대한 원리적이고 수학적인 이론을 갖는 것이 왜 그렇게 중요한가?
궁금한 점이 있는데, 이론적 / 이론적 기계 학습을하는 것이 왜 그렇게 중요한가? 인간으로서 개인적 관점에서, 나는 왜 머신 러닝이 중요한지를 이해할 수 있습니다. 인간은 자신이하는 일을 이해하는 것을 좋아합니다. 이론의 관점에서 수학은 재미있다 사물의 디자인을 안내하는 원칙이있을 경우 무작위 추측, 이상한 시행 착오에 소요되는 시간이 줄어 듭니다. 우리가 신경망이 실제로 …

6
신경망은 이미지를 어떻게 인식합니까?
이 질문은 교차 검증에서 답변 될 수 있기 때문에 스택 오버플 로 에서 마이그레이션 되었습니다. 7 년 전에 이주했습니다 . 신경망이 이미지 인식에서 어떻게 작동하는지 배우려고합니다. 나는 몇 가지 예를 보았고 더 혼란스러워졌습니다. 20x20 이미지의 문자 인식의 예에서 각 픽셀의 값은 입력 레이어가됩니다. 400 개의 뉴런. 그런 다음 숨겨진 뉴런 …

10
왜 신경망과 딥 러닝을 버리지 않습니까? [닫은]
폐쇄되었습니다 . 이 질문은 의견 기반 입니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 일반적으로 딥 러닝 및 신경망의 근본적인 문제. 교육 데이터에 적합한 솔루션은 무한합니다. 우리는 단 하나만 만족하는 정확한 …

6
볼록한 문제의 경우 SG (Stochastic Gradient Descent)의 그래디언트가 항상 전역 극단 값을 가리 킵니까?
볼록한 비용 함수가 주어지면 최적화를 위해 SGD를 사용하여 최적화 프로세스 중에 특정 지점에서 그라디언트 (벡터)를 갖게됩니다. 내 질문은 볼록한 점을 감안할 때 그라디언트가 함수가 가장 빠르게 증가 / 감소하는 방향만을 가리 키거나 그라디언트는 항상 비용 함수의 최적 / 극한 점을 가리 킵 니까? 전자는 지역 개념이고, 후자는 글로벌 개념입니다. SGD는 …

3
여러 LSTM을 스태킹하면 어떤 이점이 있습니까?
딥 네트워크에서 여러 개의 LSTM을 나란히 쌓아 두는 이점은 무엇입니까? LSTM을 사용하여 일련의 입력을 단일 입력으로 나타냅니다. 그래서 일단 그 단일 표현을 가졌는데 왜 다시 통과해야합니까? 나는 자연어 생성 프로그램에서 이것을 보았 기 때문에 이것을 요구하고 있습니다.

1
정류 선형 단위가 비선형으로 간주되는 이유는 무엇입니까?
정류 선형 유닛 (ReLU) 의 활성화 기능이 비선형으로 간주되는 이유는 무엇 입니까? f(x)=max(0,x)f(x)=max(0,x) f(x) = \max(0,x) 입력이 긍정적 일 때 선형 적이며 딥 네트워크의 대표적 힘을 풀기위한 나의 이해에서 비선형 활성화는 필수입니다. 그렇지 않으면 전체 네트워크가 단일 계층으로 표현 될 수 있습니다.

3
Adam Optimizer가 하이퍼 매개 변수의 값에 대해 강력한 것으로 간주되는 이유는 무엇입니까?
저는 Deep Learning 의 Adam 최적화 프로그램에 대해 읽었으며 Bengio, Goodfellow 및 Courville 의 새 책 Deep Learning 에서 다음 문장 을 보았습니다. Adam은 일반적으로 학습 매개 변수를 제안 된 기본값에서 변경해야하지만 하이퍼 매개 변수를 선택하는 데 상당히 강력한 것으로 간주됩니다. 이것이 사실이라면 하이퍼 파라미터 검색은 딥 러닝 시스템의 통계 …

4
인공 신경망에서 인간의 뇌에 대해 무엇을 배울 수 있습니까?
질문 / 제목이 구체적이지 않다는 것을 알고 있으므로 다음과 같이 정리하려고합니다. 인공 신경망은 비교적 엄격한 디자인을 가지고 있습니다. 물론, 그들은 일반적으로 생물학의 영향을 받아 실제 신경망의 수학적 모델을 구축하려고 시도하지만 실제 신경망에 대한 우리의 이해는 정확한 모델을 만들기에는 충분하지 않습니다. 따라서 실제 신경망에 "가까운"정확한 모델이나 어떤 것도 상상할 수 없습니다. …

2
자동 인코더는 의미있는 기능을 배울 수 없습니다
이 두 가지와 같은 50,000 개의 이미지가 있습니다. 그들은 데이터 그래프를 묘사합니다. 이 이미지에서 기능을 추출하고 싶어서 Theano (deeplearning.net)에서 제공하는 자동 인코더 코드를 사용했습니다. 문제는 이러한 자동 인코더가 기능을 배우지 않는 것입니다. RBM을 시도했지만 동일합니다. MNIST 데이터 세트는 훌륭한 기능을 제공하지만 내 데이터가 전혀 생성되지 않는 것 같습니다. 아래 예제를 …

2
Krizhevsky의 '12 CNN은 첫 번째 계층에서 253,440 개의 뉴런을 어떻게 얻습니까?
에서 알렉스 Krizhevsky, 등. 심층 컨볼 루션 신경망을 사용한 이미지 넷 분류 는 각 계층의 뉴런 수를 열거합니다 (아래 다이어그램 참조). 네트워크의 입력은 150,528 차원이며 네트워크의 나머지 계층에있는 뉴런의 수는 253,440–186,624–64,896–64,896–43,264–4096–4096–1000으로 제공됩니다. 3D 뷰 첫 번째 이후의 모든 층에 대한 뉴런의 수는 분명합니다. 뉴런을 계산하는 간단한 방법 중 하나는 해당 …

2
드롭 아웃과 드롭 연결의 차이점은 무엇입니까?
드롭 아웃과 드롭 연결의 차이점은 무엇입니까? AFAIK, 드롭 아웃은 훈련 중에 숨겨진 노드를 임의로 삭제하지만 테스트 중에는 유지하고 드롭 연결 드롭 연결을 유지합니다. 그러나 연결을 삭제하는 것이 숨겨진 노드를 삭제하는 것과 같지 않습니까? 노드 (또는 연결)가 가중치 집합이 아닙니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.