답변:
분류기에 따라 문제를 해결하는 방법에는 여러 가지가 있습니다. 슬라이딩 윈도우는 내가 가장 친숙한 방법으로 신경망 방법에 사용됩니다. 이 방법에는 작은 하위 이미지를 가져 와서 약간의 겹침으로 위아래로 이동하는 것이 포함됩니다. 일부 문제에는 최적의 시프트 매개 변수 및 다중 스케일 문제 찾기가 포함됩니다.
최종 탐지는 일반적으로 분류자가 각 하위 이미지가 해당 클래스에 속하는지 얼마나 확신하는지에 따라 결정됩니다 (예 : 과반수 투표, 총 가능성 또는 결정 경계와의 총 거리). 아래에 일부 자료를 나열했습니다. 첫 번째는 HOG 분류기 방법에 대한 것이지만 개념은 동일합니다.
CNN을 사용하는 경우 아무런 문제가 발생하지 않습니다. 나는 얼굴을 인식하기 위해 CNN을 만들었고, 얼굴의 높이는 보통 70 % 정도이기 때문에 80x100 픽셀의 훈련 이미지를 사용했습니다 (머리가 비스듬한 경우 약간의 추가 너비). 그래도 필터는 정사각형이어야합니다.
모든 변경 사항은 이제 크기를 알려주는 하나의 값 대신 활성화 / 풀링 맵의 너비와 높이를 추적해야한다는 것입니다. 예를 들어-
80 x 100의 입력 이미지 Apply 5 x 5 회선 필터는 76 x 96에서 활성화 맵을 제공합니다. 2 x 2 풀링 적용은 38 x 48에서 풀링 된 활성화 맵을 제공합니다.