컴퓨터 비전에서의 응용으로 인해 CNN (Convolutional Neural Network)을 연구하고 있습니다. 저는 표준 피드 포워드 신경망에 이미 익숙하므로 일부 사람들이 CNN을 이해하는 데 도움이 될 수 있기를 바랍니다. CNN에 대한 생각은 다음과 같습니다.
- 기존 피드 포워드 NN에는 각 요소가 "입력 레이어"에서 NN에 입력 한 기능 벡터로 구성된 학습 데이터가 있으므로 이미지 인식을 통해 각 픽셀을 하나의 입력으로 만들 수 있습니다. 그것들은 우리의 특징 벡터입니다. 다른 방법으로, 아마도 더 작은 다른 특징 벡터를 수동으로 만들 수도 있습니다.
- CNN의 장점은 이미지 왜곡 및 위치에 더 변하지 않는 더 강한 특징 벡터를 생성 할 수 있다는 것입니다. 다음 이미지에서 볼 수 있듯이 ( 이 튜토리얼에서 ) CNN은 기능 맵을 생성 한 다음 표준 신경망에 공급합니다 (실제로 거대한 전처리 단계).
- "더 나은"기능을 얻는 방법은 컨벌루션과 서브 샘플링을 번갈아가는 것입니다. 서브 샘플링이 어떻게 작동하는지 이해합니다. 각 기능 맵에 대해 픽셀의 서브 세트를 가져 오거나 픽셀 값을 평균화 할 수 있습니다.
그러나 내가 주로 혼란스럽게하는 것은 회선 단계가 어떻게 작동하는지입니다. 나는 확률 이론 (2 개의 랜덤 변수의 합에 대한 밀도)의 컨볼 루션에 익숙하지만 CNN에서 어떻게 작동하며 왜 효과적입니까?
내 질문은 유사하다 이 하나 있지만 왜 특히, 나는 확실하지 않다 첫번째 회선 단계가 작동합니다.