다음은 Lowe 2004 논문 ( http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf ) 에서 발췌 한 것 입니다.
한 가지 확실한 방법은 키포인트 주변의 로컬 이미지 강도를 적절한 규모로 샘플링하고 정규화 된 상관 관계 측정을 사용하여 일치시키는 것입니다. 그러나 이미지 패치의 간단한 상관 관계는 정의 또는 3D 시점 변경 또는 비 강성 변형과 같은 샘플의 잘못된 등록을 유발하는 변화에 매우 민감합니다. Edelman, Intrator 및 Poggio (1997)는 더 나은 접근 방식을 보여주었습니다. 그들의 제안 된 표현은 생물학적 시력, 특히 일차 시각 피질의 복잡한 뉴런의 모델을 기반으로했다.이러한 복잡한 뉴런은 특정 방향 및 공간 주파수에서 구배에 반응하지만, 망막의 구배 위치는 정확하게 국소화되지 않고 작은 수용 장 위로 이동할 수 있습니다. 에델만 (Edelman) 등. 이러한 복잡한 뉴런의 기능은 다양한 관점에서 3D 물체의 매칭 및 인식을 허용하는 것으로 가정되었다.
SIFT 설명자를 이해하려고합니다. 이전 단계 (키포인트 감지기)를 이해합니다.
왜 그런 식으로 구현되는지 모르겠습니다. 이야기 뒤의 이야기를 알고 싶습니다.