«deep-learning» 태그된 질문

데이터의 계층 적 표현을 학습하는 데 사용되는 기술과 관련된 새로운 기계 학습 연구 영역으로, 주로 심층 신경망 (즉, 둘 이상의 숨겨진 레이어가있는 네트워크)과 일종의 확률 적 그래픽 모델로 수행됩니다.


4
LSTM 시계열 예측 주위의 예측 구간
LSTM (또는 다른 반복적) 신경망으로부터 시계열 예측에 대한 예측 간격 (확률 분포)을 계산하는 방법이 있습니까? 예를 들어, 마지막 10 개의 관측 된 샘플 (t-9 ~ t)을 기반으로 미래에 10 개의 샘플 (t + 1 ~ t + 10)을 예측한다고 가정하면, t + 1에서의 예측은 더 많을 것으로 예상됩니다 t + …



2
심층 신경망 훈련 시각화
훈련 중에 가중치를 플롯하기 위해 멀티 레이어 네트워크에 해당하는 Hinton Diagrams를 찾으려고합니다. 훈련 된 네트워크는 Deep SRN과 다소 유사합니다. 즉, 여러 개의 힌튼 다이어그램의 동시 플롯을 시각적으로 혼란스럽게 만드는 다중 가중치 매트릭스가 많이 있습니다. 누구나 여러 계층의 반복 네트워크에 대한 가중치 업데이트 프로세스를 시각화하는 좋은 방법을 알고 있습니까? 주제에 관한 …

5
드롭 아웃이 모델에서 일부 뉴런을 억제한다는 점에서 드롭 아웃 레이어를 추가하면 딥 / 머신 러닝 성능이 개선되는 이유는 무엇입니까?
일부 뉴런을 제거하면 더 나은 성능의 모델이 생성되는 경우, 처음에는 더 적은 수의 뉴런과 더 적은 뉴런으로 더 단순한 신경망을 사용하지 않겠습니까? 처음에 더 크고 복잡한 모델을 만들고 나중에 그 일부를 억제하는 이유는 무엇입니까?

3
컨볼 루션이 항상 홀수를 filter_size로 사용하는 이유
CNN (ConvNet)을 사용하여 출판 된 논문의 90-99 %를 살펴 보는 경우. 대부분은 홀수의 필터 크기를 사용 합니다 . {1, 3, 5, 7}은 가장 많이 사용됩니다. 이러한 상황은 몇 가지 문제로 이어질 수 있습니다.이 필터 크기의 경우 일반적으로 2의 패딩 (공통 패딩)으로 컨볼 루션 연산이 완벽하지 않으며 프로세스에서 input_field의 일부 가장자리가 …

2
가중치 및 바이어스 초기화를 0 주위에서 선택해야하는 이유는 무엇입니까?
나는 이것을 읽었다 : 신경망을 훈련시키기 위해 각 매개 변수 W (l) ijWij (l)와 각 b (l) ibi (l)을 0 근처의 작은 임의의 값으로 초기화합니다 (예 : Normal (0, ϵ2) Normal (0) , ϵ2) 작은 ϵϵ에 대한 분포, 즉 0.01) 에서 스탠포드 깊은 자습서를 학습 7 번째 단락에서 역 전파 …

1
딥 러닝의 1D 컨볼 루션 레이어 란 무엇입니까?
2D 또는 3D 구현의 경우 이미지 처리를위한 딥 러닝에서 컨볼 루션 레이어의 역할과 메커니즘에 대해 잘 이해하고 있습니다. 이미지에서 2D 패턴 (3D의 경우 3 개 채널)을 "간단하게"포착하려고합니다. 그러나 최근에 나는 자연 언어 처리의 맥락에서 1D 컨볼 루션 레이어에 부딪 혔습니다. 내 이해에는 2D 컨볼 루션이 1D (벡터) 형태로는 드러날 수없는 …

3
추론에 GPU 또는 CPU를 사용해야합니까?
GPU로 훈련받은 딥 러닝 신경망을 실행하고 있습니다. 이제 추론을 위해 이것을 여러 호스트에 배포하고 싶습니다. 문제는 추론을 위해 GPU 또는 CPU를 사용해야하는지 여부를 결정하는 조건은 무엇입니까? 아래 주석에서 더 자세한 내용을 추가하십시오. 나는 이것에 익숙하지 않으므로 지침에 감사드립니다. 메모리 : GPU는 K80 프레임 워크 : Cuda와 cuDNN 워크로드 당 데이터 …

3
딥 러닝 NN과 현재 (2016)는 4 년 전에 공부 한 (NN)과 어떻게 다른가요?
Wikipedia 와 deeplearning4j 에서 DLNN ( Deep-Learning NN)은 숨겨진 계층이 1보다 큰 NN이라고합니다. 이러한 종류의 NN은 대학에서 표준 이었지만 DLNN은 매우 과장된 것입니다. 거기에 있었습니까? 큰 문제는 무엇입니까? 또한 스택 NN이 딥 러닝으로 간주된다고 들었습니다. 딥 러닝은 실제로 어떻게 정의됩니까? NN에 대한 나의 배경은 대부분 직업이 아닌 대학 출신입니다. 산업에서 …

2
Keras의 Early Stopping 콜백에서 사용하는 메트릭을 변경해야합니까?
Keras 교육에서 Early Stopping 콜백을 사용하는 경우 일부 메트릭 (일반적으로 유효성 검증 손실)이 증가하지 않으면 중지됩니다. 검증 손실 대신 다른 측정법 (정밀도, 리콜, f- 측정)을 사용하는 방법이 있습니까? 지금까지 본 모든 예제는 다음과 비슷합니다. 콜백 .EarlyStopping (monitor = 'val_loss', patience = 5, verbose = 0, mode = 'auto')

1
Keras의 멀티 태스킹 학습
Keras에서 공유 레이어를 구현하려고합니다. Keras에는 keras.layers.concatenate있지만, 사용에 대한 설명서는 확실하지 않습니다. 여러 개의 공유 레이어를 만드는 데 사용할 수 있습니까? Keras를 사용하여 아래에 표시된 것처럼 간단한 공유 신경 네트워크를 구현하는 가장 좋은 방법은 무엇입니까? 3 개의 NN에 대한 모든 입력, 출력 및 공유 레이어의 모양은 동일합니다. 세 개의 NN에는 여러 …

1
딥 러닝의 정사각형 이미지에 대한 이유
VGG, ResNet 등과 같은 대부분의 고급 딥 러닝 모델에는 일반적으로 픽셀 크기가 정사각형 이미지가 입력으로 필요합니다 .224x224224x224224x224 입력이 동일한 모양이어야하는 이유가 있습니까? 아니면 이라고 말하는 Convnet 모델을 만들 수 있습니까 (예를 들어 팩스 인식을 원하고 세로 이미지가있는 경우)?100x200100x200100x200 와 같이 더 큰 픽셀 크기로 이점이 증가 합니까?512x512512x512512x512

2
검증 손실 및 정확도는 일정하게 유지
이 논문을 일련의 의료 이미지에 구현하려고합니다 . Keras에서하고 있습니다. 네트워크는 기본적으로 4 개의 conv 및 max-pool 레이어와 완전히 연결된 레이어 및 소프트 최대 분류기로 구성됩니다. 내가 아는 한,이 논문에서 언급 한 아키텍처를 따랐습니다. 그러나 유효성 검사 손실 및 정확도는 전체적으로 동일하게 유지됩니다. 정확도는 ~ 57.5 %로 고정 된 것으로 보입니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.