«deep-learning» 태그된 질문

데이터의 계층 적 표현 학습과 관련된 머신 러닝 영역은 주로 심층 신경망을 사용하여 수행됩니다.

3
여러 LSTM을 스태킹하면 어떤 이점이 있습니까?
딥 네트워크에서 여러 개의 LSTM을 나란히 쌓아 두는 이점은 무엇입니까? LSTM을 사용하여 일련의 입력을 단일 입력으로 나타냅니다. 그래서 일단 그 단일 표현을 가졌는데 왜 다시 통과해야합니까? 나는 자연어 생성 프로그램에서 이것을 보았 기 때문에 이것을 요구하고 있습니다.

1
정류 선형 단위가 비선형으로 간주되는 이유는 무엇입니까?
정류 선형 유닛 (ReLU) 의 활성화 기능이 비선형으로 간주되는 이유는 무엇 입니까? f(x)=max(0,x)f(x)=max(0,x) f(x) = \max(0,x) 입력이 긍정적 일 때 선형 적이며 딥 네트워크의 대표적 힘을 풀기위한 나의 이해에서 비선형 활성화는 필수입니다. 그렇지 않으면 전체 네트워크가 단일 계층으로 표현 될 수 있습니다.


3
Adam Optimizer가 하이퍼 매개 변수의 값에 대해 강력한 것으로 간주되는 이유는 무엇입니까?
저는 Deep Learning 의 Adam 최적화 프로그램에 대해 읽었으며 Bengio, Goodfellow 및 Courville 의 새 책 Deep Learning 에서 다음 문장 을 보았습니다. Adam은 일반적으로 학습 매개 변수를 제안 된 기본값에서 변경해야하지만 하이퍼 매개 변수를 선택하는 데 상당히 강력한 것으로 간주됩니다. 이것이 사실이라면 하이퍼 파라미터 검색은 딥 러닝 시스템의 통계 …

2
Krizhevsky의 '12 CNN은 첫 번째 계층에서 253,440 개의 뉴런을 어떻게 얻습니까?
에서 알렉스 Krizhevsky, 등. 심층 컨볼 루션 신경망을 사용한 이미지 넷 분류 는 각 계층의 뉴런 수를 열거합니다 (아래 다이어그램 참조). 네트워크의 입력은 150,528 차원이며 네트워크의 나머지 계층에있는 뉴런의 수는 253,440–186,624–64,896–64,896–43,264–4096–4096–1000으로 제공됩니다. 3D 뷰 첫 번째 이후의 모든 층에 대한 뉴런의 수는 분명합니다. 뉴런을 계산하는 간단한 방법 중 하나는 해당 …

2
필터 매트릭스의 요소를 초기화하는 방법은 무엇입니까?
라이브러리 (Convnet 또는 TensorFlow와 같은)에 의존하지 않는 Python 코드를 작성하여 회선 신경 네트워크를 더 잘 이해하려고 노력하고 있으며 커널 매트릭스의 값을 선택하는 방법에 대한 문헌에 갇혀 있습니다. 이미지에서 컨볼 루션을 수행합니다. 아래 그림의 CNN 계층을 보여주는 기능 맵 사이의 단계에서 구현 세부 사항을 이해하려고합니다 . 이 다이어그램에 따르면 : 커널 …

3
스택 형 컨볼 루션 오토 인코더의 아키텍처는 무엇입니까?
그래서 나는 convolutional net을 사용하여 인간의 이미지에 대해 사전 훈련을하려고합니다. 나는 논문 ( Paper1 및 Paper2 ) 과이 stackoverflow link를 읽었 지만 그물의 구조를 이해하고 있는지 잘 모르겠습니다 (논문에 잘 정의되어 있지 않습니다). 질문 : 입력과 노이즈 레이어, 컨볼 루션 레이어, 풀링 레이어를 차례로 가질 수 있는데, 출력을하기 전에 풀링을 …

1
주의 메커니즘은 정확히 무엇입니까?
주의 메커니즘은 지난 몇 년 동안 다양한 딥 러닝 논문에서 사용되었습니다. Open AI의 연구 책임자 인 Ilya Sutskever는 다음과 같이 열정적으로 찬사를 보냈습니다 : https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Purdue University의 Eugenio Culurciello는 RNN과 LSTM을 순전히주의 기반 신경망에 찬성하여 포기해야한다고 주장했습니다. https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 이 과장 보인다, 그러나 순전히 관심 기반 모델은 시퀀스 모델링 작업에 아주 …



3
이미지 형식 (png, jpg, gif)이 이미지 인식 신경망의 훈련 방법에 영향을 줍니까?
나는 깊고 회선이 많은 신경망으로 이미지 인식, 이미지 분류 등과 관련하여 많은 발전이 있었다는 것을 알고 있습니다. 그러나 PNG 이미지와 같이 그물을 훈련하면 인코딩 된 이미지 에만 작동 합니까? 다른 이미지 속성 이 이것에 영향을 줍니까? (알파 채널, 인터레이스, 해상도 등?)

4
딥 러닝 모델에 대해 softmax 출력이 불확실성 측정이 아닌 이유는 무엇입니까?
나는 현재 시맨틱 세그먼테이션 / 인스턴스 세그먼테이션을위한 이미지 데이터에 대해 컨볼 루션 신경망 (Convolutional Neural Networks, CNN)과 함께 일 해왔다. 필자는 종종 네트워크 출력의 소프트 맥스를 "히트 맵"으로 시각화하여 특정 클래스의 픽셀 당 활성화가 얼마나 높은지를 확인했습니다. 나는 낮은 활성화를 "불확실한"/ "자신감없는"것으로 해석하고 높은 활성화를 "확실한"/ "자신감있는"예측으로 해석했습니다. 기본적으로 이것은 …

2
제한된 Boltzmann 기계 : 기계 학습에 어떻게 사용됩니까?
배경: 예, RBM (Restricted Boltzmann Machine)을 사용하여 신경망의 가중치를 시작할 수 있습니다. 또한 "신속한 계층"방식으로 심층 네트워크를 구축 (즉, 최상위 계층에서 번째 계층 을 학습 한 다음 의 상단 층 번째 번째 층 헹군 반복 ...)( N - 1 ) , N + 1 , Nnnn(n−1)(n−1)(n-1)n+1n+1n+1nnn . RBM 사용 방법에 …

2
신경망 강화
최근에 나는 adaboost, gradient boost와 같은 boosting algorithm을 배우고 있었고 가장 많이 사용되는 약한 학습자가 나무라는 사실을 알고 있습니다. 신경망을 기본 학습자로 사용하기위한 최근의 성공적인 사례 (논문 또는 기사를 의미 함)가 있는지 알고 싶습니다.

2
병목 현상 아키텍처는 신경망에서 어떻게 작동합니까?
[2 개의 3x3 전환 레이어]가 [하나의 1x1 전환, 하나의 3x3 전환 및 다른 1x1 전환 레이어]로 대체되는 ResNet 논문에서 발견되는 유형으로 병목 현상 아키텍처를 정의합니다 . 1x1 전환 레이어는 치수 축소 (및 복원)의 형태로 사용되며 다른 게시물 에서 설명 합니다. 그러나 왜이 구조가 원래 레이아웃만큼 효과적인지 확실하지 않습니다. 몇 가지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.