이미지에서 피처를 추출하는 좋은 방법입니까?


13

이미지에서 기능을 추출하려고하는데 추출하려는 포인트를 얻지 못하여 이미지가 템플릿과 일치하지 않습니다.

SIFT를 이미지에 적용하기 전에 확인해야 할 체크 포인트가 있습니까? 예를 들어 템플릿 이미지는 다음과 같습니다.
여기에 이미지 설명을 입력하십시오

목표 이미지; 여기에 이미지 설명을 입력하십시오


1
이미지의 종류와 기능을 사용하려는 대상에 따라 다릅니다. 더 많은 정보를 바랍니다.

답변:


14

sift를 사용하여 템플릿을 이미지와 일치시킬 때해야 할 일은 템플릿에 대해 sift를 실행 한 다음 장면에서 해당 정렬에서 해당 sift 기능을 찾는 것입니다.

경험 법칙 : 좋아하는 것을 비교하십시오.

Sift (이미지)에 포함 된 Sift (템플릿)

"원하는 기능"을 추출하도록 Sift를 조정할 수 없습니다. Sift * 변하지 않는 측정 값을 사용하여 가장 중요한 기능을 찾습니다. (* Chris A)

템플릿에서 특정 기능을 찾으려면 해당 기능의 더 작은 템플릿을 만들어 검색하십시오.

그냥 제안입니다. 어떤 유형의 장면이나 이미지에 적합한 유형의 템플릿인지 정확히 알 수 없습니다.


7
+1, 동의합니다. 한 가지만 빼고 SIFT는 가장 변하지 않는 기능을 찾지 않습니다. 변하지 않는 측정 값을 사용하여 가장 중요하다고 생각되는 기능을 찾습니다.

7

두 이미지 만 일치 시키려면 (예 : 공통점 찾기) CBIR (콘텐츠 기반 이미지 검색-템플릿 이미지로 데이터베이스를 검색하여 목적).

현재 CBIR 연구를하고 있으므로 현재 방법에 대해 최신 정보를 얻었습니다. 여기여기 에 stackoverflow에서와 비슷한 문제에 대한 내 답변의 링크가 있습니다.

이제 SIFT에 대해 조금 이야기하겠습니다. Lowe 가 처음 도입 한 경우 SIFT라는 용어는 특징 탐지 프로세스 와 탐지 된 관심 포인트에서 계산 된 특징 설명자 모두에 적용됩니다 . 오늘날까지 SIFT 디스크립터 는 믿을 수 없을 정도로 대단한 것으로 입증되었습니다. 디스크립터에는 @Totero가 이미 언급 한 멋진 속성이 있습니다.

반면, 오늘날 점점 더 DoG (Difference of Gaussians)라고하는 SIFT 탐지 방법 은 더 이상 최신 기술이 아닙니다. 여전히 널리 사용되지만 기능 탐지 프로세스에는 오늘날 더 많은 방법이 있으며 그 중 일부는 DoG 프로세스 추출에서 불변 키포인트 유형을 보완하는 것이 좋습니다.

대부분의 현재 논문 (링크 된 스택 오버 플로우 질문의 링크 참조)에는 여러 가지 기능 감지 기능을 결합 한 다음 SIFT 설명자 (설명 자로 여전히 흔들리는 SIFT 설명자)를 사용하여 불변 벡터 표현을 계산합니다. 현재 DoG (이미지의 모서리 부분에 초점을 맞추고 있음 ) 와 MSER 영역 (여러 스케일을 통해 얼룩 모양의 구별되는 점에 초점을 맞추고 있음 ) 의 조합으로 작업하고 있습니다. 특정 이미지 데이터베이스에서이 조합이 만족스럽지 않은 경우 더 많은 유형의 피처 검출기를 시도하고 실험 해 볼 수 있습니다.

당신이 관심이 있다면 또한, 여기에 다른 감지 및 기술자 조합의 preformances을 평가하는 논문입니다. DoG & MSER + SIFT 가 저에게 잘 작동 하기 때문에 읽지 못했지만 그것을 훑어 보았고 종이는 꽤 좋습니다.

추신 : 내가 연결된 IEEEXplore 데이터베이스에 액세스 할 수없는 경우 Google Scholar를 사용하십시오.


간단한 설명 : DoG는 가우스 차이 (두 가우스 필터 응답의 차이)를 나타냅니다
Libor

2

이전 응답을 바탕으로 :

(1) 내장 검출기 대신 밀도가 높은 샘플링과 함께 SIFT (또는이 로컬 패치 디스크립터의 다른 개선 된 변형)를 사용할 수 있습니다. 성능 및 계산 비용 요구 사항에 맞게 로컬 패치의 크기와 샘플링 밀도를 선택할 수 있습니다.

(2) SIFT는 넓은베이스 라인 스테레오 매칭을위한 아핀의 불변의 디스크립터입니다. 즉, SIFT는 이미지를 가져 와서 이미지에 아핀 변환을 유도 할 때 잘 작동합니다. 여기에서 '템플릿'은 대상 이미지에 변환이 있어야합니다.

제안 : (a) 이미지 감지 가능성을 높이기 위해 (가능한 경우) 템플릿 이미지 데이터베이스를 만듭니다.

(b) 작업에 CBIR 접근 방식을 채택하기로 선택한 경우 BoW 모델을 기준으로 사용할 수 있습니다.

(c) 템플릿 이미지를 관련 부분에만 자르고 밀도가 높은 SIFT를 사용하십시오. http://www.vlfeat.org/overview/dsift.html

(4) 나중에 PHOG (Pyramidal Histogram of Gradients) 등과 같은 다중 스케일 디스크립터를 사용하여 잠재적으로 결과를 개선 할 수 있습니다. http://www.vlfeat.org/overview/dsift.html#tut.dsift.phow

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.