프로젝트에서 딥 러닝을 사용하고 싶습니다. 나는 두 개의 논문을 봤는데 질문이 생겼다 : 컨볼 루션 신경망과 딥 러닝 사이에는 어떤 차이가 있는가? 이것들이 같거나 큰 차이점이 있으며 어느 것이 더 낫습니까?
프로젝트에서 딥 러닝을 사용하고 싶습니다. 나는 두 개의 논문을 봤는데 질문이 생겼다 : 컨볼 루션 신경망과 딥 러닝 사이에는 어떤 차이가 있는가? 이것들이 같거나 큰 차이점이 있으며 어느 것이 더 낫습니까?
답변:
딥 러닝은 DNN (Deep Neural Networks)을 기반으로하는 기계 학습의 지점으로, 최소 3 개 또는 4 개의 레이어 (입력 및 출력 레이어 포함)를 갖는 신경 네트워크를 의미합니다. 그러나 일부 사람들 (특히 비 기술적)의 경우 모든 신경망은 깊이에 관계없이 딥 러닝 자격이 있습니다. 그리고 다른 사람들은 10 층 신경망을 얕은 것으로 생각합니다.
CNN (Convolutional Neural Networks)은 가장 널리 사용되는 신경망 아키텍처 중 하나입니다. 이미지 처리는 물론 음성 인식, 자연어 처리 등과 같은 다른 많은 작업에서도 매우 성공적입니다. 최첨단 CNN은 상당히 깊고 (최소 수십 층) 딥 러닝의 일부입니다. 그러나 간단한 작업을 위해 얕은 CNN을 만들 수 있습니다.이 경우 딥 러닝이 아닙니다.
그러나 CNN은 단독이 아니며, RNN (Recurrent Neural Networks), 자동 엔코더, 트랜스포머, Deep Belief Nets (DBB = RBM (Restricted Boltzmann Machines)의 스택) 등을 포함하여 다른 많은 신경망 아키텍처가 있습니다. 그들은 얕거나 깊을 수 있습니다. 참고 : 얕은 RNN도 딥 러닝의 일부로 간주 될 수 있습니다. 트레이닝을하면 시간이 지남에 따라 풀어야하므로 그물이 깊어집니다.
적응 형 신호 처리 / 머신 러닝 분야에서 딥 러닝 (DL) 은 머신의 복잡한 표현을 훈련 할 수있는 특정 방법론입니다.
일반적으로 일련의 계층 적으로 누적 된 ( '깊은'출처) 작업을 통해 입력 를 대상 목표 매핑 할 수있는 공식이 있습니다. . 이러한 연산은 일반적으로 선형 연산 / 투영 ( )에 이어 비선형 성 ( )이 뒤 따릅니다 .
현재 DL 내에는 여러 가지 아키텍처가 있습니다 . 이러한 아키텍처 중 하나를 CNN ( Convolutional Neural Net )이라고합니다. 다른 아키텍처는 MLP ( Multi-Layer Perceptron ) 등 으로 알려져 있습니다. 다른 아키텍처는 다른 유형의 문제를 해결하는 데 적합합니다.
MLP는 아마도 가장 전통적인 유형의 DL 아키텍처 중 하나 일 것입니다. 이는 이전 계층의 모든 요소가 다음 계층의 모든 요소에 연결될 때입니다. 다음과 같이 보입니다 :
MLP에있어서, matricies 인코딩 다른 하나의 층으로부터 변환. (행렬 곱하기를 통해). 만약 다음 20 개 뉴런에 연결된 하나의 층 (10 개) 신경 세포가 예를 들어, 다음은 매트릭스 것이다 의 입력을 매핑하는 것이다 을 출력 에 출력합니다. . 모든 열은 레이어의 모든 요소에서 다음 레이어의 요소 중 하나로 가는 모든 가장자리를 인코딩합니다 .
MLP는 훈련하기가 어려워서 호의를 얻지 못했습니다. 그 어려움에 대한 많은 이유가 있지만, 그 중 하나는 밀도가 높은 연결로 인해 다양한 컴퓨터 비전 문제에 맞게 쉽게 확장 할 수 없었기 때문입니다. 다시 말해서, 번역 평형이 구워지지 않았습니다. 즉, 이미지의 한 부분에 민감해야 할 신호가 있다면, 민감도를 조정하는 방법을 다시 학습해야합니다. 그 신호는 움직였다. 이것은 그물의 용량을 낭비하고 훈련이 어려워졌습니다.
CNN이 온 곳입니다! 다음은 하나의 모습입니다.
그들은 때문에 CNNs는 신호 변환 문제를 해결 컨 볼브 이때 사방, 검출기 (커널) 각각의 입력 신호를, 따라서 동일한 기능에 민감 할 수 있지만. 이 경우, 우리의 방정식은 여전히 똑같아 보이지만, 가중치 수학 는 실제로 컨볼 루션 토플 리츠 수학 입니다. 수학은 동일합니다.
"CNNs"는 네트 전체에 컨볼 루션 레이어가있는 네트와 맨 끝에 MLP가있는 것을 참조하는 것이 일반적입니다.
딥 러닝 = 딥 인공 신경망 + 다른 종류의 딥 모델 .
심층 인공 신경망 = 1 층 이상의 인공 신경망. ( 더 많은 토론 은 심층 신경망 또는 위키 백과 의 최소 계층 수 참조 )
컨볼 루션 신경망 = 인공 신경망의 유형
Yann LeCun의이 슬라이드 는 기능 계층 구조가있는 모델 만 (낮은 수준의 기능은 모델의 한 레이어에서 학습 한 다음 해당 기능이 다음 단계에서 결합 됨) 깊이를 강조 합니다.
CNN은 깊거나 얕을 수 있습니다. 이는 2 계층 모델을 포함한 특정 신경망 이 깊지 않기 때문에이 "기능 계층 구조"구성을 따르는 지 여부에 따라 달라집니다 .
Deep learning
다중 레이어로 복잡한 신경망을 다루는 일반적인 용어입니다. 정확히 무엇인지에 대한 표준 정의는 없습니다 deep
. 일반적으로 딥 네트워크는 랩톱과 PC가 훈련하기에는 너무 큰 것으로 생각할 수 있습니다. 데이터 세트가 너무 커서 메모리에 맞출 수 없습니다. 훈련 속도를 높이려면 GPU가 필요할 수 있습니다.
Deep
다른 것보다 전문적인 사운드를 만드는 마케팅 용어와 비슷합니다.
CNN
심층 신경망의 한 유형이며 다른 많은 유형이 있습니다. CNN은 이미지 인식에 매우 유용한 응용 프로그램을 가지고 있기 때문에 인기가 있습니다.