답변:
필드 자체가 너무 광대합니다. 그래서 나는 당신이 여기에 완전한 목록을 가질 수 있는지 의심합니다. 그러나 MPEG 7 은이 영역을 표준화하기위한 주요 노력 중 하나입니다. 여기에 포함 된 것은 보편적이지 않지만 최소한 가장 기본적입니다.
다음은 MPEG7에서 식별되는 몇 가지 주요 기능 세트입니다 (실제로는 Visual Descriptors에 대해서만 이야기 할 수 있지만 다른 사람들은 이 를 전체 범위에서 볼 수는 없습니다 ).
비주얼 디스크립터에는 4 가지 범주가 있습니다.
1. 색 설명자 :
주요
색상,
색상 레이아웃 (필수적으로 블록별로 기본 색상)
확장 가능한 색상 (본질적으로 색상 히스토그램),
색상 구조 (본질적으로 로컬 색상 히스토그램)
및 색상 공간으로 구성되어 상호 작용할 수 있습니다.
2. 질감 기술자 (참고 이를 포함)
텍스처 브라우징 디스크립터 - 입도 / 거칠기, 규칙 성, 및 방향을 정의한다. 균질 텍스처 디스크립터-Gabor 필터 뱅크를 기반으로합니다. 및
에지 히스토그램
3. 형태 설명 포함
지역 기반 디스크립터 고려 형상의 스칼라 속성이다 - 등 ecentricities 영역뿐만
기반 형상을 포착하는 특성을 실제의 형상 특징과
3D 디스크립터
4. 비디오
카메라 모션에 대한 모션 설명자 (3D 카메라 모션 매개 변수)
모션 궤적 (장면의 객체) [예 : 추적 알고리즘에 의해 추출 됨] 파라 메트릭 모션 (예 : 장면의 모션을 설명 할 수있는 모션 벡터). 다양한 객체에 대해 더 복잡한 모델이 될 수 있습니다).
의미 론적 설명자인 활동.
MPEG 7은 "이 추출 방법"을 정의하지 않으며, 의미와 의미를 표현 / 저장하는 방법 만 정의합니다. 따라서 추출 및 사용 방법에 대한 연구가 있습니다.
이 주제에 대한 통찰력을 제공하는 또 다른 좋은 논문 이 있습니다.
그러나 그렇습니다. 이러한 기능 중 상당수는 다소 기본적이며 더 많은 연구가 더 정교하고 복잡한 기능 세트를 만들 수 있습니다.
Ok 조금만 더 검색하면 적합한 목록을 찾은 것 같습니다. Deselaers 등 의 논문 이 있습니다 . 내가 찾던 이음새!
이 주제와 관련된 논문을 묶은 책도 있습니다. 이를 시각 정보 검색 원칙 이라고 합니다.
@Dipan Mehta는 사용할 수있는 기능 설명자를 다루었습니다 . 이제 CBIR에 적합한 기능을 추출하는 기능 감지 방법 을 언급하여 코인의 반대편을 살펴 보겠습니다 .
CBIR 연구에 대한 나의 참고 문헌은 Sivic, Zisserman 및 Nister, Stewenius 의 논문 이었다 . 이 저자들로부터 더 많은 최신 논문이 있지만, 이것들은 모든 관련 아이디어를 제시합니다.
그들은 효율적인 CBIR 방법 을 구현하기 위해 보완적인 특성의 특징을 사용해야한다고 주장한다.
모양 적응 영역 - 모서리와 같은 형상의중심에 있는 경향이 있습니다.
예 : 해리스 코너, 멀티 스케일 해리스, DoG (가우스 차이)-가장자리에도 반응합니다!)
최대한 안정적 지역 -에서 중심되는 경향이 방울 같은 기능
예 : MSER (최대 안정적인 외부 영역), DoG
놀랍게도, Wikipedia 는 현재 널리 사용되는 기능의 대부분에 대해 감지되는 관심 영역 유형을 나타내는 기능 (검출기) 유형의 우수한 분류를 제공합니다.
필자가 읽은 대부분의 최신 기사는 SIFT (Scale-invariant feature transform) 설명자가 흔들리고 선택한 지형지 물 탐지기와 함께 사용하기에 충분히 강력 하다는 것을 맹세합니다 . 참고 문헌은 다음과 같습니다.
노트! 이 논문들은 CBIR을 엄격하게 다루지는 않지만 CBIR 관련 작업 에서 참고 자료로 사용된다 .
마지막으로 성공적인 CBIR 방법은 기능 탐지기 와 사용 된 설명자 에만 의존 할 뿐만 아니라 다음 과 같이 언급합니다 .
또한, 이미 관련된 몇 가지 질문에 대답 한 CBIR을 에 DSP 와 유래를 , 모두는 참조 및 설명과 함께 동반 난 당신이보고 싶을 수도 그래서 그들은 관련이 있다고 생각된다 :