회선 플라이는 일반 회선 네트워크와 어떻게 다릅니 까?


9

나는 현재이 논문 의 결과를 재현하기 위해 노력하고있다 . 이 논문에서는 특징 추출을 위해 CNN을 사용하는 방법을 설명하고 Dnn-hmm이고 RBM을 사용하여 사전 훈련 된 음향 모델을 가지고 있습니다.

섹션 III 하위 섹션 A는 입력 데이터를 표현할 수있는 다른 방법을 설명합니다. 정적, 델타 및 델타 델타의 스펙트럼 플롯을 수직으로 쌓기로 결정했습니다.

따라서 : 여기에 이미지 설명을 입력하십시오

그런 다음이 문서는 네트워크의 상태를 설명합니다. 그들은 회선 네트워크를 사용한다고 말하지만 네트워크 구조에 대해서는 아무것도 없습니다. 더욱이 네트워크는 항상 컨볼 루션 플라이로 지칭됩니까? 나는 일반적인 네트워크 회선 신경망 (cnn)과 비교하여 어떤 차이가 있는지 확신합니다.

이 논문은 차이점에 대해 다음과 같이 설명합니다.

(섹션 III 하위 섹션 B에서)

그러나 컨벌루션 플라이는 두 가지 중요한 측면에서 완전히 연결된 표준 숨겨진 레이어와 다릅니다. 먼저, 각 컨볼 루션 유닛은 입력의 로컬 영역에서만 입력을 수신합니다. 즉, 각 단위는 입력의 로컬 영역의 일부 기능을 나타냅니다. 둘째, 컨벌루션 플라이의 단위는 여러 개의 피쳐 맵으로 구성 될 수 있으며, 동일한 피쳐 맵의 모든 단위는 동일한 가중치를 공유하지만 하위 레이어의 다른 위치에서 입력을받습니다.

내가 궁금했던 또 다른 것은 종이에 실제로 dnn-hmm 음향 모델을 공급하는 데 필요한 출력 매개 변수가 몇 개나 있는지 여부가 있습니다. 필터의 수, 필터 크기 등을 디코딩 할 수없는 것 같습니다. 네트워크의 일반적인 세부 사항은 무엇입니까?


나는 이것에도 관심이 있습니다. 현상금을 내고 프로세스 속도를 높일 수있을 것 같아요.
Lamda

답변:


4

컨벌루션 플라이는 일반 컨벌루션 레이어와 정확히 동일한 것 같습니다. 논문에서 그들은 "CNN 레이어"라는 용어는 일반적으로 풀링 레이어가 뒤 따르는 컨볼 루션 레이어를 의미한다고 주장합니다. 혼동을 줄이기 위해 그들은 회선 부분을 "컨볼 루션 플라이"라고하고 풀링 부분을 "풀링 플라이"라고합니다.

CNN 용어에서, 연속적으로도 2의 한 쌍의 회선 및 풀링 계층은 일반적으로 하나의 CNN "계층"으로 지칭된다. 따라서 깊은 CNN은 두 개 이상의 이러한 쌍으로 연속적으로 구성됩니다. 혼동을 피하기 위해 회선 및 풀링 레이어를 각각 회선 및 풀링 플라이라고합니다.

아이러니하게도, 이것은 혼란 을 증가 시켜서이 게시물로 이어졌습니다. 당시 필자는 풀링 레이어 앞에 여러 개의 회선 레이어를 연속적으로 배치하는 것이 일반적이지 않다고 생각하지만 현대 건축에서는 종종 이것을 볼 수 있습니다.

네트워크 구조에 대한 다른 질문에 대답합니다. 그들은 실험 섹션 (섹션 VB)에서 사용하는 네트워크의 구조를 설명합니다. 위해 희망 혼란을 줄이고, 나는 "레이어"와 단어 "플라이"를 대체했습니다 :

이 실험에서 우리는 하나의 컨볼 루션 [layer], 하나의 풀링 [layer] 및 두 개의 완전히 연결된 숨겨진 레이어를 맨 위에 사용했습니다. 완전히 연결된 레이어에는 각각 1000 개의 장치가 있습니다. 회선 및 풀링 매개 변수는 풀링 크기 6, 시프트 크기 2, 필터 크기 8, FWS의 150 기능 맵 및 LWS의 주파수 대역 당 80 기능 맵입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.