RGB 히스토그램을 사용하는 것에서 벗어나는 것을 고려하는 것이 좋습니다.
이미지의 2d Haar 웨이블릿을 취하고 (소리보다 훨씬 쉬우 며, 계수에 가중치를 부여하는 데 사용되는 평균과 제곱근이 많음) 가장 큰 k를 유지하면 이미지의 더 나은 다이제스트를 얻을 수 있습니다. 웨이블릿의 가중치 계수를 희소 벡터로 정규화하고 저장하여 크기를 줄입니다. 최소한 사전에 지각 가중치를 사용하여 RG 및 B의 스케일을 조정하거나 YIQ (또는 양자화 노이즈를 피하기 위해 YCoCg)로 전환하여 중요도를 낮추면서 색차 정보를 샘플링 할 수 있도록 권장합니다.
이제 이러한 희소 정규화 된 벡터 중 두 개의 내적을 유사성의 척도로 사용할 수 있습니다. 가장 큰 내적을 가진 이미지 쌍은 구조가 매우 유사 할 것입니다. 이것은 크기 조정, 색조 이동 및 워터 마킹에 약간 저항하고 구현하기 쉽고 컴팩트하다는 이점이 있습니다.
k를 늘리거나 줄여서 저장소와 정확도를 절충 할 수 있습니다.
단일 숫자 점수로 정렬하는 것은 이러한 종류의 분류 문제에 대해 다루기 어려울 것입니다. 생각해 보면 이미지는 한 축을 따라 '변경'할 수 있어야하지만 그렇지 않습니다. 이것이 특징 벡터가 필요한 이유입니다. Haar 잔물결의 경우 이미지에서 가장 날카로운 불연속이 발생하는 대략적인 위치입니다. 이미지 사이의 거리를 쌍으로 계산할 수 있지만, 거리 측정법뿐이므로 선형 순서는 모두 똑같이 멀리있는 3 개의 이미지로 구성된 '삼각형'을 표현할 방법이 없습니다. (즉, 모두 녹색 인 이미지, 모두 빨간색 인 이미지 및 모두 파란색 인 이미지를 생각해보십시오.)
즉, 문제에 대한 실제 솔루션은 보유한 이미지 수에 O (n ^ 2) 연산이 필요합니다. 측정 값을 선형화 할 수 있었다면 O (n log n) 만 필요하거나 측정 값이 기수 정렬에 적합한 경우 O (n) 만 필요할 수 있습니다. 즉, 실제로는 전체 세트를 살펴볼 필요가 없기 때문에 O (n ^ 2)를 소비 할 필요가 없습니다. 일부 임계 값보다 가까운 것을 찾아야합니다. 따라서 희소 벡터 공간을 분할하기 위해 여러 기술 중 하나를 적용하면 모든 이미지를 모든 이미지와 순진하게 비교하는 것보다 '주어진 임계 값보다 더 유사한 이미지의 k 찾기'문제에 대해 훨씬 더 빠른 무증상을 얻을 수 있습니다. 당신은 아마도 당신이 요구 한 것이 정확하지 않다면 필요할 것입니다.
어쨌든 저는 몇 년 전 제가 저장하고있는 서로 다른 텍스처의 수를 최소화하려고 할 때 개인적으로 좋은 효과를 내기 위해 이것을 사용했지만,이 공간에서 그 효능을 보여주는 많은 연구 소음이있었습니다 (이 경우 비교 보다 정교한 형태의 히스토그램 분류) :
http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf
더 나은 탐지 정확도가 필요한 경우 minHash 및 tf-idf 알고리즘을 Haar 웨이블릿 (또는 히스토그램)과 함께 사용하여 편집을보다 강력하게 처리 할 수 있습니다.
http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf
마지막으로 Stanford는 이러한 종류의 접근 방식의 좀 더 이국적인 변형을 기반으로 이미지 검색을 제공합니다. 웨이블릿에서 더 많은 특징 추출을 수행하여 이미지의 회전 또는 크기 조정 된 섹션 등을 찾는 데 기반을 두지 만 이는 아마도 작업량을 넘어 설 것입니다. 하고 싶다.
http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi