컨볼 루션 신경망과 딥 러닝의 차이점은 무엇입니까?


25

프로젝트에서 딥 러닝을 사용하고 싶습니다. 나는 두 개의 논문을 봤는데 질문이 생겼다 : 컨볼 루션 신경망과 딥 러닝 사이에는 어떤 차이가 있는가? 이것들이 같거나 큰 차이점이 있으며 어느 것이 더 낫습니까?


딥 러닝과 컨볼 루션 신경망과 정확히 다른 점을 알려주세요. 저는이 두 가지 주제에서 혼란을
느끼고

답변:


33

딥 러닝은 DNN (Deep Neural Networks)을 기반으로하는 기계 학습의 지점으로, 최소 3 개 또는 4 개의 레이어 (입력 및 출력 레이어 포함)를 갖는 신경 네트워크를 의미합니다. 그러나 일부 사람들 (특히 비 기술적)의 경우 모든 신경망은 깊이에 관계없이 딥 러닝 자격이 있습니다. 그리고 다른 사람들은 10 층 신경망을 얕은 것으로 생각합니다.

CNN (Convolutional Neural Networks)은 가장 널리 사용되는 신경망 아키텍처 중 하나입니다. 이미지 처리는 물론 음성 인식, 자연어 처리 등과 같은 다른 많은 작업에서도 매우 성공적입니다. 최첨단 CNN은 상당히 깊고 (최소 수십 층) 딥 러닝의 일부입니다. 그러나 간단한 작업을 위해 얕은 CNN을 만들 수 있습니다.이 경우 딥 러닝이 아닙니다.

그러나 CNN은 단독이 아니며, RNN (Recurrent Neural Networks), 자동 엔코더, 트랜스포머, Deep Belief Nets (DBB = RBM (Restricted Boltzmann Machines)의 스택) 등을 포함하여 다른 많은 신경망 아키텍처가 있습니다. 그들은 얕거나 깊을 수 있습니다. 참고 : 얕은 RNN도 딥 러닝의 일부로 간주 될 수 있습니다. 트레이닝을하면 시간이 지남에 따라 풀어야하므로 그물이 깊어집니다.


@MiniQurak. 내가 틀렸다는 것을 수정하십시오. 내가 이해하는 것은 CNN은 Autoencoders, Deep Belief Nets, Recurrent Neural Networks (RNN)와 같은 딥 네트의 아키텍처 중 하나 일뿐입니다. 맞습니까?
Aadnan Farooq A

네 맞습니다.
MiniQuark

그렇다면 데이터 세트에 따라 어떤 아키텍처가 더 나은지 말할 수 있습니까? 또는 주요 요인은 무엇입니까?
Aadnan Farooq A

1
CNN은 이미지 인식 작업에 적합합니다. 또한 데이터가 지역 패턴 (예 : 선분)이 큰 패턴 (예 : 정사각형, 삼각형)으로 조립되고 더 큰 패턴 (예 : 집, 평면)으로 조립 된 형태의 계층 구조를 가질 때마다 빛납니다. 음성 인식 작업에 적합합니다. RNN은 시계열 (예 : 날씨 예측) 및 일반적으로 데이터 시퀀스 (예 : 문장) 처리에 적합합니다. NLP (자연어 처리)에 많이 사용됩니다. AutoEncoder는 감독되지 않으며 데이터의 패턴을 학습합니다.
MiniQuark

1
그럼 :)
Firebug

21

적응 형 신호 처리 / 머신 러닝 분야에서 딥 러닝 (DL) 은 머신의 복잡한 표현을 훈련 할 수있는 특정 방법론입니다.

일반적으로 일련의 계층 적으로 누적 된 ( '깊은'출처) 작업을 통해 입력 를 대상 목표 매핑 할 수있는 공식이 있습니다. . 이러한 연산은 일반적으로 선형 연산 / 투영 ( )에 이어 비선형 성 ( )이 뒤 따릅니다 .xyWifi

y=fN(...f2(f1(xTW1)W2)...WN)

현재 DL 내에는 여러 가지 아키텍처가 있습니다 . 이러한 아키텍처 중 하나를 CNN ( Convolutional Neural Net )이라고합니다. 다른 아키텍처는 MLP ( Multi-Layer Perceptron ) 등 으로 알려져 있습니다. 다른 아키텍처는 다른 유형의 문제를 해결하는 데 적합합니다.

MLP는 아마도 가장 전통적인 유형의 DL 아키텍처 중 하나 일 것입니다. 이는 이전 계층의 모든 요소가 다음 계층의 모든 요소에 연결될 때입니다. 다음과 같이 보입니다 :

여기에 이미지 설명을 입력하십시오

MLP에있어서, matricies 인코딩 다른 하나의 층으로부터 변환. (행렬 곱하기를 통해). 만약 다음 20 개 뉴런에 연결된 하나의 층 (10 개) 신경 세포가 예를 들어, 다음은 매트릭스 것이다 의 입력을 매핑하는 것이다 을 출력 에 출력합니다. . 모든 열은 레이어의 모든 요소에서 다음 레이어의 요소 중 하나로 가는 모든 가장자리를 인코딩합니다 .WiWR10x20vR10x1uR1x20u=vTWW

MLP는 훈련하기가 어려워서 호의를 얻지 못했습니다. 그 어려움에 대한 많은 이유가 있지만, 그 중 하나는 밀도가 높은 연결로 인해 다양한 컴퓨터 비전 문제에 맞게 쉽게 확장 할 수 없었기 때문입니다. 다시 말해서, 번역 평형이 구워지지 않았습니다. 즉, 이미지의 한 부분에 민감해야 할 신호가 있다면, 민감도를 조정하는 방법을 다시 학습해야합니다. 그 신호는 움직였다. 이것은 그물의 용량을 낭비하고 훈련이 어려워졌습니다.

CNN이 온 곳입니다! 다음은 하나의 모습입니다.

여기에 이미지 설명을 입력하십시오

그들은 때문에 CNNs는 신호 변환 문제를 해결 컨 볼브 이때 사방, 검출기 (커널) 각각의 입력 신호를, 따라서 동일한 기능에 민감 할 수 있지만. 이 경우, 우리의 방정식은 여전히 ​​똑같아 보이지만, 가중치 수학 는 실제로 컨볼 루션 토플 리츠 수학 입니다. 수학은 동일합니다. Wi

"CNNs"는 네트 전체에 컨볼 루션 레이어가있는 네트와 맨 끝에 MLP가있는 것을 참조하는 것이 일반적입니다.


1
+1 큰 대답, 방금 toeplitz matricies에 대해 배웠습니다. ;-)
MiniQuark

@MiniQuark 감사합니다! 예-당신은 토플 리츠 행렬에 의한 곱셈으로서 컨볼 루션을 작성할 수 있습니다 :)
Tarin Ziyaee

@TarinZiyaee and MiniQurak 초보자가 딥 러닝에 대해 자세히 배울 수있는 좋은 책 / 저널 기사 / 자습서를 제안 해 주시겠습니까?
Aadnan Farooq A

CNN은 반드시 깊은 것은 아닙니다 (-1)
Firebug

7

딥 러닝 = 딥 인공 신경망 + 다른 종류의 딥 모델 .

심층 인공 신경망 = 1 층 이상의 인공 신경망. ( 더 많은 토론 은 심층 신경망 또는 위키 백과 의 최소 ​​계층 수 참조 )

컨볼 루션 신경망 = 인공 신경망의 유형


충분히 딥 러닝에는 "다층 커널 시스템"도 포함되어 있으며 CNN은 얕을 수 있습니다. :)
MiniQuark

@MiniQuark p.
Franck Dernoncourt

레이어가 1 개 이상인 인공 신경망 ..... 레이어가 2 개인 네트워크가 딥 네트워크라고 확신하지 않습니다.
SmallChess

1
@StudentT 어쩌면 마케팅에서 일하지 않을 수도 있습니다;) en.wikipedia.org/w/…
Franck Dernoncourt

1
CNN이 반드시 깊을 필요는 없으며 딥 러닝은 ANN에 대한 것이 아니라 (일반적인 의미에서) 최고 답변이되어야합니다.
Firebug

6

Yann LeCun의이 슬라이드 는 기능 계층 구조가있는 모델 만 (낮은 수준의 기능은 모델의 한 레이어에서 학습 한 다음 해당 기능이 다음 단계에서 결합 됨) 깊이를 강조 합니다.

CNN은 깊거나 얕을 수 있습니다. 이는 2 계층 모델을 포함한 특정 신경망 이 깊지 않기 때문에이 "기능 계층 구조"구성을 따르는 지 여부에 따라 달라집니다 .

얀 레쿤의 정의


3

Deep learning다중 레이어로 복잡한 신경망을 다루는 일반적인 용어입니다. 정확히 무엇인지에 대한 표준 정의는 없습니다 deep. 일반적으로 딥 네트워크는 랩톱과 PC가 훈련하기에는 너무 큰 것으로 생각할 수 있습니다. 데이터 세트가 너무 커서 메모리에 맞출 수 없습니다. 훈련 속도를 높이려면 GPU가 필요할 수 있습니다.

Deep 다른 것보다 전문적인 사운드를 만드는 마케팅 용어와 비슷합니다.

CNN심층 신경망의 한 유형이며 다른 많은 유형이 있습니다. CNN은 이미지 인식에 매우 유용한 응용 프로그램을 가지고 있기 때문에 인기가 있습니다.


네트워크에 숨겨진 레이어가 두 개 이상인 경우 일반적으로 깊이있는 것으로 간주되며 대부분의 사람들은 숨겨진 레이어가 10 개 이상인 것이 확실하다는 데 동의합니다. 랩톱에서 딥 네트워크를 훈련시키는 것이 가능합니다. 항상 그렇게합니다. 특히 전송 학습 (예 : 사전 훈련 된 네트워크의 계층 재사용) 및 / 또는 데이터 기능 보강을 사용하는 경우 데이터 집합이 크지 않아도 됩니다. "딥"이라는 단어에는 많은 과대 광고가 있지만 딥 러닝을위한 전용 기술이 있으므로 과대 광고가 아닙니다. :)
MiniQuark

@MiniQuark 데이터 확대로 데이터 세트는 여전히 커질 것입니다. 단지 작은 것부터 시작합니다.
SmallChess

좋은 지적입니다. 내가 말하려는 것은 대부분의 데이터를 즉석에서 생성하므로 데이터 세트가 메모리에 적합하다는 것입니다.
MiniQuark
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.