CNN에서 완전히 연결된 계층의 기능은 무엇입니까?


19

회선 및 풀링 계층을 이해하지만 CNN에서 완전히 연결된 계층의 이유를 알 수 없습니다. 이전 레이어가 출력 레이어에 직접 연결되지 않은 이유는 무엇입니까?

답변:


31

컨볼 루션 레이어의 출력은 데이터의 고급 기능을 나타냅니다. 출력을 평탄화하여 출력 레이어에 연결할 수 있지만 완전히 연결된 레이어를 추가하는 것은 이러한 기능의 비선형 조합을 배우는 (일반적으로) 저렴한 방법입니다.

본질적으로 컨볼 루션 레이어는 의미 있고, 저 차원이며 다소 변하지 않는 피쳐 공간을 제공하며, 완전히 연결된 레이어는 해당 공간에서 (비선형) 기능을 배우고 있습니다.

참고 : FC 레이어를 Conv 레이어로 변환하는 것은 쉽지 않습니다. 페이지에서 설명 하는 것처럼 이러한 최상위 FC 레이어를 Conv 레이어로 변환하면 도움 될 수 있습니다 .


답변 해 주셔서 감사합니다 제임스. 그래서 우리는 역전 파로 연결된 레이어들 사이의 가중치를 배우고 있습니다. 맞습니까?
제프

예. 오류는 완전히 연결된 레이어를 통해 컨볼 루션 레이어와 풀링 레이어로 역 전파됩니다.
jamesmf

확인. 따라서 fc 레이어의 목적은 비선형 PCA처럼 생각할 수 있으며 "좋은"기능을 수정하고 전체 가중치를 학습하여 다른 기능을 줄입니다.
제프

1
대부분 비선형 기능 조합을 허용합니다. "죽은"기능이 없다고 가정하면 모든 기능이 양호 할 수 있지만 이러한 기능의 조합이 더 나을 수 있습니다.
jamesmf

@ jamesmf : 죽은 기능은 무엇입니까? 그리고 당신이 말하는 기능의 조합은 무엇입니까? 비선형 조합이란 무엇입니까? cnn에서 완전히 연결된 레이어를 사용해야합니까? 또는 정확도에 악영향을주지 않고 대체 할 수 있습니까? 많은 감사드립니다. 내가 질문 한 것에 대해 직감을 줄 수 있다면 감사 할 것입니다.
Rika

4

나는에 의해이 대답을 발견 아닐-샤르마을Quora의 도움이.

전체 네트워크 (분류 용)를 두 부분으로 나눌 수 있습니다.

  • 특징 추출 : SVM과 같은 기존 분류 알고리즘에서는 분류 작업이 가능하도록 데이터에서 특징을 추출하는 데 사용했습니다. 컨볼 루션 레이어는 동일한 기능 추출 목적을 제공합니다. CNN은 더 나은 데이터 표현을 캡처하므로 기능 엔지니어링을 수행 할 필요가 없습니다.

  • 분류 : 피쳐 추출 후 데이터를 다양한 클래스로 분류해야하며, 이는 완전히 연결된 (FC) 신경망을 사용하여 수행 할 수 있습니다. 완전히 연결된 레이어 대신 SVM과 같은 기존 분류기를 사용할 수도 있습니다. 그러나 우리는 일반적으로 FC 레이어를 추가하여 모델을 완벽하게 훈련시킬 수있게합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.