최근 몇 년 동안 CNN (Convolutional Neural Networks)은 컴퓨터 비전의 객체 인식을위한 최첨단 기술이되었습니다. 일반적으로 CNN은 여러 개의 컨볼 루션 레이어로 구성되고 그 뒤에 완전히 연결된 두 레이어가 있습니다. 이것에 대한 직관은 컨볼 루션 레이어가 입력 데이터의 더 나은 표현을 배우고 완전히 연결된 레이어는 레이블 세트 로이 표현을 분류하는 법을 배우는 것입니다.
그러나 CNN이 지배하기 전에 SVM (Support Vector Machine)이 최첨단이었습니다. 따라서 SVM은 여전히 2 계층 완전 연결된 신경망보다 강력한 분류기라고 할 수 있습니다. 따라서 최신 CNN이 SVM이 아닌 분류를 위해 완전히 연결된 계층을 사용하는 이유가 궁금합니다. 이런 식으로, 강력한 기능 표현보다는 강력한 분류기보다는 강력한 기능 표현과 강력한 분류기 등 두 가지 이점을 모두 누릴 수 있습니다.
어떤 아이디어?