가변 피처 설명자 스케일 및 회전


16

피처 감지에 사용하기 위해 일부 스케일 및 회전 불변 피처 설명자를 나열 할 수 있습니다.

이 응용 프로그램은 멀티 클래스 분류기를 사용하여 UAV로 캡처 한 비디오에서 자동차와 인간을 감지하는 데 사용됩니다.

지금까지 나는 SIFT와 MSER (아주 불변 인)를보고있다. 나는 또한 LESH를 보았습니다. LESH는 지역 에너지 모델을 기반으로하지만 회전 불변이 아닌 방식으로 계산됩니다. 나는 로컬 에너지를 사용하고 회전 불변을 구축하는 방법을 생각하려고했습니다. 기능 설명자, 여기를 읽었습니다 . 상용 응용 프로그램에서 사용할 수있는 SIFT / SURF의 무료 대안은 무엇입니까? , "관심 점에 방향을 할당하고 그에 따라 이미지 패치를 회전하면 회전 불변이 무료로 제공됩니다." 감사합니다


OpenCV 라이브러리에서 ORB (Oriented FAST and Rotated BRIEF)를 사용하십시오.
Harsh Wardhan

답변:


9

SIFT / SURF에 대한 대안으로, 당신이 연결질문 은 아주 좋은 답변을 제공합니다.

읽을 수있는 질문이 두 개 더있었습니다.

  • "유용한 (예 : 회전 불변) 기능 설명자를 어떻게 만들 수 있습니까?
  • "연관된 질문의 진술과 관련하여, 그는 어떻게 자유 회전 불변성을 달성합니까?"

기능 설명자 작성

이것은 유효한 연구 주제입니다. 좋은 기능 설명자는 오후에 누구나 만들 수있는 것이 아닙니다. 사람들은 원하는 속성을 가진 기능 설명자를 성공적으로 모델링 할 때 기사를 게시합니다. 이것이 바로 현재 소수의 최신 설명자가 사용되는 이유이기도 합니다 . 또한 귀하에게 필요한 기능 설명자를 찾으십시오 .

"무료"회전 불변 달성

0|black->gray->white||white->gray->black|9090

이렇게하면 항상 동일한 지배적 인 방향 (회전 된 패치)으로 이미지 패치에서 설명자를 계산하므로 회전 불변을 얻을 수 있습니다.


4

회전 불변을 무료로 얻는 또 다른 방법은 회전 불변 인 객체를 선택하는 것입니다. 예를 들어, 원 또는 링은 회전에 변하지 않습니다.

기능 추출기 : 엣지 감지. 각 NxN픽셀 주변에 대해 에지 방향과 크기 2D 히스토그램을 계산합니다. 총 크기가 높고 각도 분포 가 높은 모든 점을 찾습니다 . 방사형 대칭이없는 모든 점을 제거합니다.

기능 설명 : 각 원형 객체의 중심을 찾습니다. 객체가 원형이므로 지배적 인 경사각이 없습니다. 모든 각도가 동일합니다. 따라서, 방사상 프로파일 (극좌표에서의 픽셀 값의 합)은 각도 불변 기술자이다.


그건 그렇고, 기점이 전기 회로 보드에서 원으로 제조되는 이유 중 하나입니다.

여기에 이미지 설명을 입력하십시오


우리는 키포인트 (기능) 디스크립터 에 대해 이야기하고 있습니다. 피처 (관심 포인트) 에 대해 이야기한다면 원형 패치를 감지하는 것이 유용 할 수 있습니다. 모든 디스크립터와 함께 회 전적으로 변하지 않습니다. 그러나 원형 패치에서 계산 된 설명자는 수평 직경이 검은 색인 흰색 원이며, 회전 불변 방법을 사용하지 않으면 세로 원이있는 경우 매우 다른 설명자를 생성합니다
penelope

@penelope, 왜 안돼? 다음 설명자 (패치의 축소판)를 고려하고 정규화 된 상호 상관이있는 다른 설명자와 비교하십시오. 이런 식으로 다른 객체로 착각 할 수 없습니다.
Andrey Rubshtein

죄송합니다, "패치의 썸네일"이 무슨 뜻인지 이해할 수 없습니까? 그리고 설명 : 패치의 정규화 된 corss-correlation은 패치 가 고리 또는 원이라는 사실이 아니라 회전 불변성을 만드는 것입니다.
penelope

@ 페넬로페, 나는 지금 충분히 명확하지 않은 것 같아요. 나는 내일 그것을 확장하려고 노력할 것입니다. 귀하의 의견에 감사드립니다.
안드레이 Rubshtein

그것에 기대 :)
페넬로페

1

차라리 KAZE / AKAZE를 살펴보면 속도가 상당히 빨라집니다. 변형 사례도 허용됩니다. OpenCV는 최근 GSoC 2014를 통해 구현을 얻었습니다. 여기에서 찾을 수 있습니다 .


1

피쳐 점 주위에 로컬 패치를 로그 극좌표 (원점이 관심 지점에 있음)로 다시 매핑하면 축척 변경은 로그-방사선 축을 따르는 평행 이동에 해당하고 회전은 평행 이동 (랩 어라운드)에 해당합니다 각도 축을 따라. 그런 다음 2 차원 푸리에 변환을 계산하면 방사형 및 각 방향의 변환이 주파수 영역에서 위상 편이가됩니다. 그런 다음 푸리에 변환의 절대 값을 계산하면 위상이 완전히 사라지고 스케일 변경 및 원본 이미지 패치의 회전이 눈에 띄지 않게됩니다. 따라서 로그 풀 좌표에서 이미지의 2D 푸리에 변환의 절대 값은 피처 설명자가됩니다.

글쎄, 적어도 이론 상으로는. 실제로 패치의 방사형 확장을 제한해야합니다. 이는 푸리에 변환 (실제로 푸리에 계열)을 계산하기 전에 데이터의 많은 부분을 잘라 내야하므로 로그-극 좌표의 로그-방사선 방향을 따른 변환은 정확히 더 이상 주파수 영역에서의 위상 편이이므로,이 방법은 완벽하게 스케일 불변성이 아닙니다. 로그 반경 좌표에 불 연속적 인 일부 창 기능 을 사용 하고 색상 강도를 곱하면이 문제가 다소 완화 될 것으로 생각됩니다.

그러나 피쳐 디스크립터는 여전히 회전 불변 값이어야합니다.

참조 : 스케일 선택이없는 스케일 불변


0

FASTBRISK 도 확인할 수 있습니다 .


내가 찾은 한, FAST는 다양한 디스크립터 조합과 함께 사용되는 탐지기 일뿐입니다. 그리고 OP와 직접 연결된 질문에 FAST와 BRISK가 이미 언급되어 있으므로 이미 이러한 방법의 존재에 대한 정보를 가지고 있다고 가정합니다.
penelope
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.