간단히 말해 컨볼 루션 연산은 두 행렬의 요소 별 곱의 조합입니다. 이 두 행렬의 차원이 일치하는 한 문제가 없어야하므로 쿼리의 동기를 이해할 수 있습니다.
A.1. 그러나 컨볼 루션의 목적은 소스 데이터 매트릭스 (전체 이미지)를 필터 또는 커널로 인코딩하는 것입니다. 더 구체적으로, 우리는 앵커 / 소스 픽셀 근처의 픽셀을 인코딩하려고합니다. 아래 그림을 살펴보십시오.
일반적으로 소스 이미지의 모든 픽셀을 앵커 / 소스 픽셀로 간주하지만이를 제한하지는 않습니다. 실제로, 보폭을 포함하는 것은 드문 일이 아니며, 여기서 앵커 / 소스 픽셀은 특정 수의 픽셀로 분리됩니다.
좋아, 소스 픽셀은 무엇인가? 커널이 중심이되는 앵커 포인트이며 앵커 / 소스 픽셀을 포함한 모든 주변 픽셀을 인코딩하고 있습니다. 커널은 대칭 적으로 형성되기 때문에 (커널 값에서는 대칭이 아님) 앵커 픽셀의 모든면 (4 연결)에 같은 수의 픽셀이 있습니다 (4). 따라서이 픽셀 수에 관계없이 대칭 모양의 커널의 각면의 길이는 2 * n + 1 (앵커의 각면 + 앵커 픽셀)이므로 필터 / 커널의 크기는 항상 홀수입니다.
만약 우리가 '전통'을 깨고 비대칭 커널을 사용한다면 어떨까요? 앨리어싱 오류가 발생하여 그렇게하지 않습니다. 우리는 픽셀을 가장 작은 개체로 간주합니다. 즉, 여기에는 하위 픽셀 개념이 없습니다.
A.2 경계 문제는 다른 접근법을 사용하여 처리됩니다. 역 연산, 즉 디컨 볼 루션을 계산하지 않고 원본 이미지의 완벽한 재구성에 관심이없는 경우 경계 문제로 인한 정보 손실 또는 노이즈 주입에 신경 쓰지 않습니다. 일반적으로 풀링 작업 (평균 풀링 또는 최대 풀링)은 어쨌든 경계 아티팩트를 제거합니다. 따라서 '입력 필드'의 일부를 무시하십시오. 풀링 작업이 그렇게합니다.
-
컨벌루션의 선 :
구식 신호 처리 영역에서, 입력 신호가 필터를 통과하거나 필터를 통과 할 때, 이전에 연관된 / 필터링 된 응답의 어떤 컴포넌트가 관련성 / 정보 적이며 그렇지 않은지를 판단하는 방법은 없었다. 결과적으로 이러한 변환에서 신호 구성 요소 (모두)를 보존하는 것이 목표였습니다.
이 신호 구성 요소는 정보입니다. 일부 구성 요소는 다른 구성 요소보다 더 유익합니다. 이것의 유일한 이유는 우리가 더 높은 수준의 정보를 추출하는 데 관심이 있기 때문입니다. 일부 시맨틱 클래스와 관련된 정보. 따라서, 우리가 특별히 관심이있는 정보를 제공하지 않는 신호 성분은 제거 될 수 있습니다. 따라서 컨볼 루션 / 필터링에 대한 오래된 교리와는 달리, 컨볼 루션 응답을 원하는대로 풀링 / 풀링 할 수 있습니다. 우리가 그렇게 느끼는 방식은 통계 모델 개선에 기여하지 않는 모든 데이터 구성 요소를 엄격하게 제거하는 것입니다.