이산 코사인 변환의 특징을 사용하여 이미지의 질감을 분류하는 것이 얼마나 실용적입니까? 인터넷 검색 "텍스처 분류 dct" 는 신경망을 사용하여이 주제에 대한 단일 학술 논문 만 찾습니다 .
내 응용 프로그램의 경우 전체 이미지가 일관된 질감 (예 : 담요, 나무 껍질, 잔디밭 등)의 근접 촬영 된 레이블이 붙은 이미지 모음이 있습니다.
이전 질문 에 대한 답변에서 영감을 얻어 다음 접근법을 고려하고있었습니다.
- 각 이미지를 NxN 픽셀 블록으로 분할
- 각 블록의 DCT를 취하십시오
- 각 DCT를 1xM 배열로 병합하여 K-Means 클러스터링 알고리즘에 공급하고 각 DCT에 대한 클러스터 레이블을 얻습니다.
- # 3에서 이미지 당 각 레이블을 계산하여 각 이미지에 대한 클러스터링 레이블의 히스토그램을 계산합니다.
- [(히스토그램, 이미지 레이블)] 집합을 공급하여 SVM 분류기를 훈련시킵니다.
이것은 얼마나 잘 작동합니까? SIFT / SURF 알고리즘을 통해 추출 된 기능을 사용하여 유사한 시스템을 구현했지만 약 60 %의 정확도 만 얻을 수있었습니다.
다른 방법으로 DCT를 사용하여 텍스처를 분류 할 수 있습니까?