«deep-learning» 태그된 질문

데이터의 계층 적 표현을 학습하는 데 사용되는 기술과 관련된 새로운 기계 학습 연구 영역으로, 주로 심층 신경망 (즉, 둘 이상의 숨겨진 레이어가있는 네트워크)과 일종의 확률 적 그래픽 모델로 수행됩니다.



6
컨볼 루션 신경망이 작동하는 이유는 무엇입니까?
나는 종종 사람들이 왜 회선 신경망이 여전히 잘 이해되지 않는다고 말하는 것을 들었습니다. Convolutional Neural Networks가 계층을 올라갈 때 점점 더 정교한 기능을 배우는 이유는 무엇입니까? 그로 인해 이러한 기능 스택이 만들어졌으며 다른 유형의 심층 신경망에도 적용됩니까?

6
딥 러닝 기본 사항
딥 러닝의 기본 사항을 자세히 설명하는 논문을 찾고 있습니다. 딥 러닝을위한 Andrew Ng 과정과 같은 것이 이상적입니다. 내가 어디에서 찾을 수 있는지 아십니까?

4
keras 모델의 정확도, F1, 정밀도 및 리콜을 얻는 방법?
바이너리 KerasClassifier 모델의 정밀도, 리콜 및 F1- 점수를 계산하고 싶지만 해결책을 찾지 못했습니다. 내 실제 코드는 다음과 같습니다. # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) model.add(Dense(1, kernel_initializer='normal', activation='sigmoid')) # …


4
경사 하강은 항상 최적으로 수렴합니까?
그래디언트 디센트가 최소로 수렴하지 않는 시나리오가 있는지 궁금합니다. 그래디언트 디센트가 항상 전역 최적으로 수렴되는 것은 아닙니다. 또한 계단 크기가 너무 클 경우 최적에서 벗어날 수 있다는 것도 알고 있습니다. 그러나, 그것이 어떤 최적에서 벗어나면 결국 다른 최적으로 갈 것 같습니다. 따라서, 경사 하강은 국부적 또는 세계적 최적으로 수렴되도록 보장 될 …

1
LSTM을 사용한 시계열 예측 : 시계열을 고정시키는 중요성
정지성과 차분 성에 관한 이 링크에서 ARIMA와 같은 모델은 평균, 분산, 자기 상관 등과 같은 통계적 속성이 시간에 따라 일정하므로 예측을 위해 정지 된 시계열을 필요로한다고 언급되었습니다. RNN은 비선형 관계를 학습 할 수있는 능력이 더 우수하기 때문에 ( 여기서 : 시계열 예측을위한 반복적 인 신경망의 약속 ) 데이터가 클 때 …

3
딥 러닝에서 가중치와 편견은 무엇입니까?
Tensorflow 웹 사이트에서 기계 학습을 배우기 시작했습니다. 나는 딥 러닝 프로그램이 따르는 흐름에 대한 매우 기초적인 이해를 개발했습니다 (이 방법은 저에게 책과 큰 기사를 읽는 대신 빨리 배우게합니다). 내가 겪은 몇 가지 혼란스러운 것들이 있습니다. 그중 2 가지가 있습니다 : 편견 무게 tensorflow 웹 사이트의 MNIST 튜토리얼에서 이미지에 특정 패턴이 …


3
딥 러닝 라이브러리를 사용하여 텍스트에서 키워드 / 구문 추출
아마도 이것은 너무 광범위하지만 텍스트 요약 작업에서 딥 러닝을 사용하는 방법에 대한 참조를 찾고 있습니다. 나는 표준 단어 빈도 접근법과 문장 순위를 사용하여 텍스트 요약을 이미 구현했지만이 작업에 딥 러닝 기술을 사용할 가능성을 탐색하고 싶습니다. 또한 감정 분석을 위해 CNN (Convolutional Neural Networks)을 사용하여 wildml.com에 제공된 일부 구현을 살펴 보았습니다 …

2
케 라스 대 tf. 케 라스
나는 사이의 선택에 혼란 조금 해요 Keras (keras 팀 / keras) 및 tf.keras을 (tensorflow / tensorflow / 파이썬 / keras /) 내 새로운 연구 프로젝트. Keras 가 누구도 소유하지 않는다는 논쟁이 있습니다 . 따라서 사람들이 더 기고하고 프로젝트를 관리하기가 훨씬 쉬워 질 것입니다. ‬ 다른 측면에서, tf.keras은 Google에서 지금보다 엄격한 …

2
ReLU가 활성화 기능으로 사용되는 이유는 무엇입니까?
활성화 함수는 w * x + b신경망 에서 유형의 선형 출력에 비선형 성을 도입하는 데 사용됩니다 . 나는 sigmoid와 같은 활성화 기능을 직관적으로 이해할 수 있습니다. 나는 역 전파 동안 죽은 뉴런을 피하는 ReLU의 장점을 이해합니다. 그러나 출력이 선형 인 경우 ReLU가 활성화 기능으로 사용되는 이유를 이해할 수 없습니다. 비선형 …

4
Keras (Python)를 사용하여 LSTM-RNN에 대한 하이퍼 파라미터 검색
Keras RNN Tutorial : " RNN 은 까다 롭습니다. 배치 크기 선택이 중요하고, 손실 및 최적화 선택이 중요합니다. 일부 구성은 수렴되지 않습니다." 따라서 이것은 Keras에서 LSTM-RNN의 하이퍼 파라미터를 튜닝하는 것에 대한 일반적인 질문입니다. RNN에 가장 적합한 매개 변수를 찾는 방법에 대해 알고 싶습니다. Keras 'Github 에서 IMDB 예제로 시작했습니다 . …

2
딥 러닝의 로컬 최소 점 vs 안 장점
Andrew Ng (안타깝게도 더 이상 찾을 수없는 비디오)에서 딥 러닝 문제에서 로컬 최소값에 대한 이해가 이제 고차원 공간에서 문제가 적은 것으로 간주된다는 의미에서 어떻게 변화했는지에 대한 이야기를 들었습니다. 딥 러닝) 임계점은 로컬 최소값보다 안 장점 또는 고원 일 가능성이 높습니다. 나는 "모든 지역 최소값이 세계 최소값"이라는 가정에 대해 논의한 논문 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.