당신은 올바른 길을 가고 있습니다.
불일치 란 어떤 방식 으로든 모양이 다양 하더라도 개체를 개체로 인식 할 수 있음을 의미합니다 . 이는 뷰어 / 카메라와 객체의 상대 위치와 같은 시각적 입력의 특정 변경 사항에 걸쳐 객체의 아이덴티티, 카테고리 등을 유지하기 때문에 일반적으로 좋습니다.
아래 이미지에는 동일한 조각상의 많은보기가 포함되어 있습니다. 실제 픽셀 값이 상당히 다르더라도 사용자 (및 잘 훈련 된 신경망)는 모든 그림에 동일한 객체가 나타나는 것을 인식 할 수 있습니다.
참고 번역 여기가 의미하는 특정 구조에서 빌려 비전을. 프랑스어에서 영어로 또는 파일 형식간에 변환하는 것과 달리 어떤 유형의 변환도 의미하지 않습니다. 대신 이미지의 각 포인트 / 픽셀이 같은 방향으로 같은 양으로 이동했음을 의미합니다. 또는 원점이 반대 방향으로 같은 양만큼 이동 한 것으로 생각할 수 있습니다. 예를 들어, 각 픽셀을 50 또는 100 픽셀 오른쪽으로 이동하여 첫 번째 행에서 두 번째 및 세 번째 이미지를 생성 할 수 있습니다.
컨볼 루션 연산자가 번역과 관련하여 통근한다는 것을 알 수 있습니다. 당신이 말다 경우
f 와
g ,이 문제는 컨 볼빙 된 (convolved) 출력 변환하지 않는 경우
f∗g 당신이 번역하는 경우, 또는
f 또는
g 먼저 다음을 컨 볼브. Wikipedia는
조금 더 있습니다.
변형 불변 객체 인식에 대한 한 가지 접근 방식은 객체의 "템플릿"을 가져 와서 이미지에서 객체의 가능한 모든 위치와 관련시키는 것입니다. 위치에서 큰 응답을 얻으면 템플릿과 유사한 객체가 해당 위치에 있음을 나타냅니다. 이 접근 방식을 종종 템플릿 일치 라고 합니다.
불변성 대 등변 량
Santanu_Pattanayak의 대답은 ( 여기 ) 번역의 차이가 있음을 지적 불변성 및 번역 equivariance . 변환 불일치 란 입력이 어떻게 이동되는지에 관계없이 시스템이 정확히 동일한 응답을 생성 함을 의미합니다. 예를 들어, 얼굴 탐지기는 맨 위 행의 세 이미지 모두에 대해 "얼굴 찾기"를보고 할 수 있습니다. 등분 산은 시스템이 여러 위치에서 똑같이 잘 작동하지만 응답이 대상의 위치와 이동 함을 의미합니다. 예를 들어, "face-iness"의 열 맵은 첫 번째 행의 이미지를 처리 할 때 왼쪽, 중앙 및 오른쪽에서 비슷한 범프를 갖습니다.
이것은 때때로 중요한 구별이지만, 많은 사람들은 두 가지 현상을 "불변성"이라고 부릅니다. 특히 등변 량 반응을 변하지 않는 반응으로 변환하는 것은 사소한 일이므로 모든 위치 정보를 무시하면됩니다).