«deep-learning» 태그된 질문

데이터의 계층 적 표현 학습과 관련된 머신 러닝 영역은 주로 심층 신경망을 사용하여 수행됩니다.

1
연결주의 시간 분류 (CTC) 란 무엇입니까?
광학 문자 인식 (OCR) 프로젝트를 수행하려고합니다. 몇 가지 연구를 한 후에 흥미로운 것으로 보이는 아키텍처 인 CNN + RNN + CTC를 발견했습니다. CNN (Convoluted Neural Network) 및 RNN (Recurrent Neural Network)에 익숙하지만 CTC (Connectionistor Temporal Classification) 란 무엇입니까? 평신도의 용어로 설명하고 싶습니다.

1
VC 차원은 딥 러닝에 대해 무엇을 알려줍니까?
기본 기계 학습에서는 다음과 같은 "엄지 손가락 규칙"을 배웁니다. a) 데이터의 크기는 가설 세트의 VC 차원 크기의 10 배 이상이어야합니다. b) N 개의 연결을 갖는 신경망은 약 N의 VC 치수를 갖는다. 따라서 딥 러닝 신경망이 수백만 단위라고 말하면 이것이 수십억 개의 데이터 포인트를 가져야한다는 의미입니까? 이것에 대해 좀 밝힐 수 …

1
머신 러닝 모델의 "용량"은 무엇입니까?
Carl Doersch의 Variational Autoencoders에 대한 이 자습서를 공부하고 있습니다. 두 번째 페이지에는 다음과 같이 표시됩니다. 가장 인기있는 프레임 워크 중 하나는이 자습서의 주제 인 Variational Autoencoder [1, 3]입니다. 이 모델의 가정은 약하고 역 전파를 통해 훈련이 빠릅니다. VAE는 근사값을 계산하지만이 근사값으로 인한 오차는 고용량 모델을 감안할 때 매우 작습니다 . …

1
왜 우리는 신경망 이외의 것들에 알맞은 기울기가 아닌 일정한 학습 속도를 사용하지 않습니까?
딥 러닝 문학은 기울기 강하에서 일정하지 않은 학습 속도를 사용하는 영리한 속임수로 가득합니다. 지수 붕괴, RMSprop, Adagrad 등은 구현하기 쉽고 모든 딥 러닝 패키지에서 사용할 수 있지만 신경망 외부에는 존재하지 않는 것 같습니다. 이것에 대한 이유가 있습니까? 사람들이 단순히 신경 쓰지 않는다면 신경망 외부에서 신경 쓰지 않아도되는 이유가 있습니까?

3
심층 신경망 — 이미지 분류만을위한 것입니까?
깊은 신념이나 회선 신경망을 사용하여 찾은 모든 예는 이미지 분류, 대화 형 탐지 또는 음성 인식에 사용됩니다. 심층 신경망은 또한 특징이 구조화되지 않은 (예를 들어, 시퀀스 또는 그리드로 배열되지 않은) 고전적 재연 작업에 유용합니까? 그렇다면 예를 들어 줄 수 있습니까?

1
스택 형 오토 인코더와 2 계층 신경망 훈련간에 차이가 있습니까?
2 레이어 스택 형 자동 인코더와 2 레이어 신경망을 구축하는 알고리즘을 작성한다고 가정 해 봅시다. 그것들이 같은 것입니까 아니면 차이점입니까? 내가 이해하는 것은 누적 된 자동 인코더를 빌드 할 때 레이어별로 빌드한다는 것입니다. 신경망의 경우, netowork의 모든 매개 변수를 초기화 한 다음 각 데이터 포인트에 대해 네트워크를 통해 전달하고 손실 …

2
2D의 공간 드롭 아웃은 어떻게 구현됩니까?
이것은 Convolutional Networks를 사용한 Efficient Object Localization 이라는 논문 과 관련이 있으며, 내가 이해 한 것은 이탈이 2D로 구현 된다는 것입니다. Spatial 2D Dropout의 구현 방식에 대한 Keras의 코드를 읽은 후 기본적으로 [batch_size, 1, 1, num_channels] 형태의 임의의 이진 마스크가 구현됩니다. 그러나이 공간적 2D 드롭 아웃은 모양 [batch_size, height, width, …

3
신경망에 기능 선택 / 엔지니어링이 필요한 이유는 무엇입니까?
특히 kaggle 경쟁과 관련하여 모델의 성능이 기능 선택 / 엔지니어링에 관한 것임을 알았습니다. 더 전통적인 / 구식 ML 알고리즘을 처리 할 때 그 이유가 무엇인지 완전히 이해할 수는 있지만 심층 신경망을 사용할 때 왜 그런지 알 수 없습니다. 딥 러닝 책 인용 : 딥 러닝은 다른 더 단순한 표현으로 표현되는 …


4
다중 출력 회귀 분석을위한 신경망
34 개의 입력 열과 8 개의 출력 열이 포함 된 데이터 세트가 있습니다. 문제를 해결하는 한 가지 방법은 34 개의 입력을 가져 와서 각 출력 열에 대해 개별 회귀 모델을 작성하는 것입니다. 이 문제를 신경망을 사용하는 하나의 모델로만 해결할 수 있는지 궁금합니다. 다층 퍼셉트론을 사용했지만 선형 회귀와 같은 여러 모델이 …

2
베이지안 딥 러닝이란 무엇입니까?
베이지안 딥 러닝이란 무엇이며 기존 베이지안 통계 및 전통적인 딥 러닝과 어떤 관련이 있습니까? 주요 개념과 수학은 무엇입니까? 파라 메트릭이 아닌 베이지안 통계라고 말할 수 있습니까? 주요 작업과 현재 주요 개발 및 응용 프로그램은 무엇입니까? 추신 : Bayesian Deep Learning은 많은 주목을 받고 있습니다. NIPS 워크숍을 참조하십시오.

1
심층 강화 학습이 불안정한 이유는 무엇입니까?
DeepMind의 심층 강화 학습에 관한 2015 년 논문에서 "안정적인 학습으로 인해 RL과 신경망을 결합하려는 이전의 시도는 크게 실패했습니다"라고 말합니다. 그런 다음이 논문은 관측에 대한 상관 관계를 기반으로이 문제의 원인을 나열합니다. 누군가 이것이 이것이 무엇을 의미하는지 설명해 주시겠습니까? 신경망이 훈련에는 있지만 시험에는 없을 수있는 일부 구조를 학습하는 과적 합의 형태입니까? 아니면 …

2
신경망이 왜 쉬운가?
신경망을 "어리석게"하기 위해 이미지를 수동으로 구성하는 방법에 대한 논문을 읽었습니다 (아래 참조). 네트워크가 조건부 확률 만 모델링하기 때문 입니까? 네트워크가 결합 확률 모델링 할 수있는 경우에도 그러한 경우가 발생합니까?p ( y , x )p(y|x)p(y|x)p(y|x)p(y,x)p(y,x)p(y,x) 내 생각에 인위적으로 생성 된 이미지가 훈련 데이터와 다르므로 확률이 낮습니다 . 따라서 이러한 이미지에 대해 …


1
심층 컨볼 루션 신경망에 유용한 데이터 확대 기술은 무엇입니까?
배경 : 저는 최근 Geoffrey Hinton의 훌륭한 연설을보고 컨볼 루션 신경망을 훈련 할 때 데이터 보강의 중요성에 대해 더 깊이 이해했습니다 . 그는 현재의 컨볼 루션 신경망은 테스트 대상 물체의 참조 프레임을 일반화 할 수 없으므로, 네트워크가 물체의 거울상이 동일하다는 것을 네트워크가 진정으로 이해하기 어렵게 만든다고 설명했다. 이 문제를 해결하기 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.