컨텐츠 기반 이미지 검색에 가능한 이미지 기능 목록


15

이미지에서 동일하거나 유사한 물체를 찾을 때의 유용성을 측정하기 위해 색상, 방향 모서리와 같은 가능한 이미지 기능 목록을 찾으려고합니다. 누구든지 그러한 목록이나 적어도 일부 기능을 알고 있습니까?


이것은 주제가 아니지만 CBIR이 Open Image 데이터 세트에서 기능을 추출 할 수 있습니까? 이미지가 로컬 디스크에 저장되지 않은 경우에도 이미지의 기능을 추출 할 수 있습니까?
Quix0te

답변:


25

필드 자체가 너무 광대합니다. 그래서 나는 당신이 여기에 완전한 목록을 가질 수 있는지 의심합니다. 그러나 MPEG 7 은이 영역을 표준화하기위한 주요 노력 중 하나입니다. 여기에 포함 된 것은 보편적이지 않지만 최소한 가장 기본적입니다.

다음은 MPEG7에서 식별되는 몇 가지 주요 기능 세트입니다 (실제로는 Visual Descriptors에 대해서만 이야기 할 수 있지만 다른 사람들은 를 전체 범위에서 볼 수는 없습니다 ).

비주얼 디스크립터에는 4 가지 범주가 있습니다.

1. 색 설명자 : 주요
색상,
색상 레이아웃 (필수적으로 블록별로 기본 색상)
확장 가능한 색상 (본질적으로 색상 히스토그램),
색상 구조 (본질적으로 로컬 색상 히스토그램)
및 색상 공간으로 구성되어 상호 작용할 수 있습니다.

2. 질감 기술자 (참고 이를 포함)
텍스처 브라우징 디스크립터 - 입도 / 거칠기, 규칙 성, 및 방향을 정의한다. 균질 텍스처 디스크립터-Gabor 필터 뱅크를 기반으로합니다. 및
에지 히스토그램

3. 형태 설명 포함
지역 기반 디스크립터 고려 형상의 스칼라 속성이다 - 등 ecentricities 영역뿐만
기반 형상을 포착하는 특성을 실제의 형상 특징과
3D 디스크립터

4. 비디오
카메라 모션에 대한 모션 설명자 (3D 카메라 모션 매개 변수)
모션 궤적 (장면의 객체) [예 : 추적 알고리즘에 의해 추출 됨] 파라 메트릭 모션 (예 : 장면의 모션을 설명 할 수있는 모션 벡터). 다양한 객체에 대해 더 복잡한 모델이 될 수 있습니다).
의미 론적 설명자인 활동.


MPEG 7은 "이 추출 방법"을 정의하지 않으며, 의미와 의미를 표현 / 저장하는 방법 만 정의합니다. 따라서 추출 및 사용 방법에 대한 연구가 있습니다.

이 주제에 대한 통찰력을 제공하는 또 다른 좋은 논문 이 있습니다.

그러나 그렇습니다. 이러한 기능 중 상당수는 다소 기본적이며 더 많은 연구가 더 정교하고 복잡한 기능 세트를 만들 수 있습니다.



6

이 주제와 관련된 논문을 묶은 책도 있습니다. 이를 시각 정보 검색 원칙 이라고 합니다.


책에 대한 Google 검색은 많은 긍정적 인 리뷰를 나타내지 않습니다. 실제로 긍정적 인 것보다 더 많은 불만. 당신은 여전히 ​​그것이 좋은 참조라고 생각합니까? 그렇다면, 그것이 언제 당신에게 도움이되었는지 알려줄 수 있습니까? :)
penelope

여기에 넣은 주된 이유는 많이 사용했기 때문이 아니라 선생님이 추천 한 것입니다 (그리고 나는 그의 의견을 소중하게 생각합니다). 이에 대한 Google 검색은 실제로 책이 아니라 종이 묶음임을 보여줍니다. 또한 매우 오래되었지만 주제에 관한 몇 권의 책 중 하나를 보여줍니다. 따라서 내 대답은 여전히 ​​적절하다고 생각합니다.
Geerten

3

@Dipan Mehta는 사용할 수있는 기능 설명자를 다루었습니다 . 이제 CBIR에 적합한 기능을 추출하는 기능 감지 방법 을 언급하여 코인의 반대편을 살펴 보겠습니다 .

CBIR 연구에 대한 나의 참고 문헌은 Sivic, ZissermanNister, Stewenius 의 논문 이었다 . 이 저자들로부터 더 많은 최신 논문이 있지만, 이것들은 모든 관련 아이디어를 제시합니다.

그들은 효율적인 CBIR 방법 을 구현하기 위해 보완적인 특성의 특징을 사용해야한다고 주장한다.

  • 모양 적응 영역 - 모서리와 같은 형상의중심에 있는 경향이 있습니다.

    예 : 해리스 코너, 멀티 스케일 해리스, DoG (가우스 차이)-가장자리에도 반응합니다!)

  • 최대한 안정적 지역 -에서 중심되는 경향이 방울 같은 기능

    예 : MSER (최대 안정적인 외부 영역), DoG

놀랍게도, Wikipedia 는 현재 널리 사용되는 기능의 대부분에 대해 감지되는 관심 영역 유형을 나타내는 기능 (검출기) 유형의 우수한 분류를 제공합니다.

  • 가장자리 감지기
  • 코너 검출기
  • 얼룩 탐지기
  • 능선 검출기

필자가 읽은 대부분의 최신 기사는 SIFT (Scale-invariant feature transform) 설명자가 흔들리고 선택한 지형지 ​​물 탐지기와 함께 사용하기에 충분히 강력 하다는 것을 맹세합니다 . 참고 문헌은 다음과 같습니다.

노트! 이 논문들은 CBIR을 엄격하게 다루지는 않지만 CBIR 관련 작업 에서 참고 자료로 사용된다 .

마지막으로 성공적인 CBIR 방법은 기능 탐지기 와 사용 된 설명자 에만 의존 할 뿐만 아니라 다음 과 같이 언급합니다 .

  • 효율적인 검색 구조 (시각적 특징의 정량화)
  • 구성하는 방법 이미지 설명을 - 중 일반적인 시각 기능 (현지 기술자)를 기반으로, 또는 (NO 참조 그래서 현재, 이것은 매우 새로운 아이디어입니다) 글로벌 이미지 설명을 비교하여
  • 이미지 디스크립터 간 거리 측정

또한, 이미 관련된 몇 가지 질문에 대답 한 CBIR을DSP유래를 , 모두는 참조 및 설명과 함께 동반 난 당신이보고 싶을 수도 그래서 그들은 관련이 있다고 생각된다 :

  • DSP : 1
  • stackoverflow : 1 , 2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.