가우시안 스케일 공간 스케일의 차이가 왜 변하지 않습니까?


15

내가 사용합니다 스케일 불변 특징 변환 여기에 예로서 알고리즘입니다. SIFT는 이미지의 스케일 된 가우시안 필터링을 기반으로 스케일 공간을 만든 다음 가우스 차이를 계산하여 잠재적 인 관심 지점을 감지합니다. 이 점들은 가우스의 차이에 따른 지역 최소 및 최대로 정의됩니다.

이 접근법은 규모가 변하지 않는다고 주장합니다 (다른 수수께끼 불변함 중). 왜 이런거야? 이것이 왜 그런지는 분명하지 않습니다.


SIFT가 무엇인지 모르면 wiki en.wikipedia.org/wiki/Scale-invariant_feature_transform 에서 찾으십시오 . "이미지 특징 생성을위한 Lowe의 방법은 이미지를 이미지 변환, 스케일링 및 회전에 불변하고 조명 변화에 부분적으로 불변이고 국소 기하 왜곡에 강인한 특징 벡터의 대규모 모음으로 이미지를 변환합니다." 그게 설명입니까?
niaren

그렇습니다, 이것이 제가 말하는 것입니다
water

SIFT는 척도 공간 이론을 사용합니다. 그러나 나는 그 이론에서 "규모"불일치가 무엇을 의미하는지 이해하지 못한다. 당신은 그것에 대해 토니 Lindeberg의 논문을 읽는 시도 할 수 있습니다 : csc.kth.se/~tony/earlyvision.html
막시무스

답변:


7

"규모 불변"이라는 용어는 다음을 의미합니다. 하자 당신이 이미지를 갖고 있다고 I을 , 당신은 (관심 지점 일명) 기능을 감지 한 f를 어떤 위치 (x, y)는 어떤 규모 수준에서 . 이제 이미지 I ' 가 있다고 가정 해 봅시다. 이미지 크기는 I (예 : 다운 샘플링)입니다. 그런 다음 지형지 물 탐지기가 스케일 불변 인 경우 해당 위치 (x ', y') 및 해당 규모 s ' 에서 I' 의 해당 지형지 물 f ' 를 감지 할 수 있어야합니다 . 여기서 (x, y, s) 그리고 (x ', y', s ') 적절한 스케일링 변환과 관련이 있습니다.

다시 말해, 스케일 불변량 검출기가 다른 사람의 얼굴에 해당하는 특징점을 감지 한 다음 같은 장면에서 카메라를 확대 또는 축소해도 해당 얼굴의 특징점을 여전히 감지해야합니다.

물론 SIFT가 제공하는 두 가지 기능을 일치시킬 수있는 "기능 설명자"를 원할 수도 있습니다.

따라서 더 혼란 스러울 위험이 있지만 여기에는 규모가 변하지 않는 두 가지가 있습니다. 하나는 스케일에 관계없이 특정 유형의 이미지 특징 (블롭)을 감지하기 때문에 스케일 불변 인 DoG 관심 포인트 검출기입니다. 즉, DoG 검출기는 모든 크기의 얼룩을 감지합니다. 다른 스케일 불변의 것은 스케일의 변화에도 불구하고 동일한 이미지 피처에 대해 다소 유사하게 유지되는 그래디언트 오리엔테이션의 히스토그램 인 피처 디스크립터입니다.

그건 그렇고, 가우시안 차이는 Laplacian-of-Gaussians 필터에 대한 근사치로 사용됩니다.


척도 공간 이론에서 일부 정보를 가져 왔습니다. 스케일 공간 이론을 사용하여 두 신호를 비교할 때 정확히 어떤 일이 일어나는지 설명해 주시겠습니까? Lindeberg의 논문에서 csc.kth.se/~tony/earlyvision.html 은 얼룩 등의 탐지에 대한 몇 가지 예를 제시했습니다. 실제로 스케일 매개 변수로 미분을 취하는 것이 스케일 불일치에 어떻게 도움이됩니까?
막시무스

당신이 올바른지. 나는 척도 공간 이론의 직관을 설명하려고 노력했을뿐입니다. 당신이 요구하는 것은 별도의 질문이어야합니다. :) 나는 당신이 말하는 것은 다른 규모로 취해진 파생 상품이 적절하게 정규화되어야한다는 것입니다. 거친 스케일로 이동하면 신호가 부드럽게되어 진폭이 줄어 듭니다. 즉, 파생 상품의 규모도 줄어 듭니다. 따라서 여러 척도에서 미분 반응을 비교하려면 다음과 같이 곱해야합니다.
Dima

시그마의 적절한 힘 : 첫 번째 시그마 파생, 두 번째 시그마 ^ 2 등
Dima

@maximus, 죄송합니다. :)
Dima

당신의 답변에 감사드립니다! 그것은 나를 도왔지만 여기에 다른 질문으로 묻은
maximus

5

가우스의 차이는 규모가 변하지 않습니다. SIFT (제한된 정도) 척도는 규모 공간에 걸쳐 DoG 극한값을 찾기 때문에 변하지 않습니다. 즉, 공간적으로나 인접하는 척도에 대해 DoG 극한의 척도를 찾는 것입니다. 이 고정 스케일 (입력 스케일의 기능이 아님)에 대해 출력 DoG가 얻어 지므로 결과는 스케일 독립적이며 스케일 불변입니다.


1
권리. 그러나 그것은 주변의 비늘을 따라 극단을 찾습니다 . 내가 실수하지 않는 한 이것은 모든 저울이 아닙니다. 비록 모든 스케일이더라도, 스케일이 어떻게 독립적인지는 아직 명확하지 않습니다
water

@water, 맞습니다. 당신은 모든 규모의 극단을 원치 않으며 지역 극단을 원합니다. 이를 통해 회색 배경의 큰 밝은 원 안에 작은 어두운 원과 같은 중첩 구조를 감지 할 수 있습니다.
Dima

DoG를 계산하는 것이 더 빠르기 때문에 LoG 대신 DoG가 사용됩니다.
막시무스
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.