가우시안 차이, 가우시안 라플라스 및 멕시코 모자 웨이블릿의 차이점은 무엇입니까?


10

CV에는 서로 매우 유사 해 보이지만 미묘한 차이가있는 세 가지 기술이 있습니다.

  • 가우시안 라플라시안 : 2[g(x,y,t)f(x,y)]
  • 가우스 차이 : [g1(x,y,t)f(x,y)][g2(x,y,t)f(x,y)]
  • Ricker 웨이블릿 과의 컨벌루션 : Ricker(x,y,t)f(x,y)

내가 현재 이해하는 바와 같이 : DoG는 LoG의 근사치입니다. 둘 다 얼룩 탐지에 사용되며 둘 다 본질적으로 대역 통과 필터로 작동합니다. 멕시코 모자 / 리커 웨이블릿과의 컨볼 루션은 거의 같은 효과를 달성하는 것으로 보입니다.

필자는 세 가지 기법을 모두 펄스 신호에 적용했는데 (크기를 비슷하게하기 위해 필요한 스케일링으로) 결과는 매우 가깝습니다. 실제로 LoG와 Ricker는 거의 동일하게 보입니다. 내가 알아 차린 유일한 차이점은 DoG 와 관련이 있습니다. LoG 및 Ricker에 대해 2 개의 무료 매개 변수 ( σ 1 ) 대 1 을 조정했습니다 . 또한 잔물결이 DoG의 경우 2 대 2의 단일 회선 (Doier의 경우 푸리에 공간에서 곱셈을 통해 수행 됨)과 LoG의 경우 Laplacian으로 수행 할 수 있기 때문에 가장 쉽고 빠릅니다. σ1σ1

Ricker wavelet convolution, Gaussian의 Laplacian 및 Gaussian의 차이 결과

  • 각 기술의 비교 장점 / 단점은 무엇입니까?
  • 하나가 다른 것에 비해 다른 사용 사례가 있습니까?

I는 이산 샘플에서 보낸 같은 조작에 로그인하고 Ricker 축퇴 것을 직관적으로 생각이 커널로서 구현 될 수있다 [ - 1 , 2 , - 1 ]2 .

[1,2,1]or[010141010]for 2D images

가우시안에이 작업을 적용하면 Ricker / Hat 웨이블릿이 생성됩니다. 또한 LoG와 DoG는 열 확산 방정식과 관련이 있기 때문에 충분한 매개 변수 왜곡과 일치시킬 수 있다고 생각합니다.

(나는 여전히이 물건으로 발을 적시고있어 자유롭게 수정할 수 있습니다!)

답변:


6

가우시안 라플라스

f

2(fg)=f2g

g

f2g=f(2x2g+2y2g)=f2x2g+f2y2g

따라서, 가우스 커널의 2 차 도함수로 입력 이미지의 2 개 컨볼 루션을 추가하는 것으로 계산할 수 있습니다 (3D에서는 3 개 컨볼 루션 등). 이것은 가우스 커널이 그 파생어와 같이 분리 가능하기 때문에 흥미 롭습니다. 그건,

f(x,y)g(x,y)=f(x,y)(g(x)g(y))=(f(x,y)g(x))g(y)

즉, 2D 컨벌루션 대신 두 개의 1D 컨볼 루션을 사용하여 동일한 것을 계산할 수 있습니다. 이것은 많은 계산을 저장합니다. 생각할 수있는 가장 작은 가우시안 커널의 경우 각 차원마다 5 개의 샘플이 있습니다. 2D 컨벌루션에는 25 곱셈과 덧셈, 2 개의 1D 컨벌루션에는 10이 필요합니다. 커널이 클수록 또는 이미지의 크기가 클수록 계산 비용이 크게 절감됩니다.

따라서, LoG는 4 개의 1D 컨볼 루션을 사용하여 계산 될 수있다. 그러나 LoG 커널 자체는 분리 할 수 ​​없습니다.

2

Ricker wavelet 또는 Mexican hat 연산자는 스케일링 및 정규화까지 LoG와 동일합니다 .

가우스의 차이

f

fg(1)fg(2)=f(g(1)g(2))

따라서 LoG와 마찬가지로 DoG는 분리 할 수없는 단일 2D 컨볼 루션 또는 분리 가능한 두 컨볼 루션의 합 (이 경우 차이)으로 볼 수 있습니다. 이런 식으로 보면 LoG보다 DoG를 사용할 때 계산상의 이점이없는 것처럼 보입니다. 그러나 DoG는 동조 가능한 대역 통과 필터이며 LoG는 같은 방식으로 동조 할 수 없으므로 미분 연산자로 간주해야합니다. DoG는 또한 스케일 공간 설정에서 자연스럽게 나타나며, 이미지는 많은 스케일 (시그마가 다른 가우스)로 필터링되며 후속 스케일 간의 차이는 DoG입니다.

DoG 커널에 대한 근사치가 분리 가능하여 계산 비용을 절반으로 줄이지 만 근사치가 등방성이 아니기 때문에 필터의 회전 의존성을 초래합니다.

한 번은 두 가우시안 커널 사이의 시그마 차이가 무한히 작은 (확장까지) DoG에 대해 LoG와 DoG의 동등성을 보여주었습니다. 나는 이것에 대한 기록이 없지만 보여주기는 어렵지 않았다.

이 필터를 계산하는 다른 형태

Laurent의 답변은 재귀 필터링을 언급하고 OP는 푸리에 도메인에서의 계산을 언급합니다. 이러한 개념은 LoG와 DoG 모두에 적용됩니다.

가우시안 및 그 유도체는 인과 안티 인과 IIR 필터를 사용하여 계산 될 수있다. 따라서 위에서 언급 한 모든 1D 컨벌루션은 시그마에서 일정한 시간에 적용 할 수 있습니다. 이것은 더 큰 시그마에만 효율적입니다.

마찬가지로 푸리에 도메인에서 컨볼 루션을 계산할 수 있으므로 DoG 및 LoG 2D 커널을 푸리에 도메인으로 변환하거나 계산하여 곱셈으로 적용 할 수 있습니다.

결론적으로

이 두 가지 접근 방식의 계산 복잡도에는 큰 차이가 없습니다. 아직 DoG를 사용하여 LoG를 근사화 할만한 충분한 이유를 찾지 못했습니다.


이것은 환상적인 답변입니다! 나는 이것을 Laurent의 대답 이 잘못되었거나 불완전 하지 않다는 것을 새로운 대답으로 업데이트 할 것 입니다.
DeusXMachina

2
DoG와 LoG는 "나무 껍질"규모로 만나
Laurent Duval

4

다음 Ricker은 (등방성) 마르 웨이블릿 멕시코 모자 또는 가우시안의 라플라시안가 동일한 개념으로 속해 웨이블릿 연속 허용 웨이블릿 (특정 조건을 만족하는). 전통적으로 Ricker wavelet은 1D 버전입니다. Marr 웨이블릿 또는 멕시코 모자는 2D 이미지 분해와 관련하여 주어진 이름입니다. 예를 들어 멀티 스케일 지오메트리 표현에 관한 파노라마의 2.2 절 , 공간, 방향 및 주파수 선택을 엇갈리게하는 , Signal Processing, 2011, L. Jacques et 알. 가우시안의 라플라시안은 다차원 일반화입니다.

그러나 실제로 사람들은 다른 수준에서 다른 유형의 이산화를 받아들입니다.

3×33×3

(010141010)

또는

(111181111)
5×5

σ1σ2

그러나 일부 라플라시안 피라미드에서는 다른 비율이 사용되어 DoG를보다 일반적인 대역 통과 필터 또는 에지 검출기로 전환했습니다.

마지막 참조 : 일반화 된 척도 공간 관심 포인트를 사용한 이미지 매칭 , T. Lindeberg, 2015.


1
매우 계몽합니다, 감사합니다! 따라서 Fast Gaussian Smoothing 과 마찬가지로 DoG는 공간 영역에서 직접 수행 할 수 있다는 점에서 계산상의 이점이 있으므로 CCD / 통합 컴퓨터 비전을위한 온칩 신호 처리를 생각합니다. 또한 A Panorama 는 전반적으로 환상적인 독서처럼 보입니다.
DeusXMachina

빠른 근사치로 다음 작업을 수행 할 수 있습니다 실제로 규모의 독립적 인 작업의 수
로랑 듀발

1
1.6의 비율은 어디에서 오는가? 수학을 쓰면 가우시안의 이차 미분과 시그마의 무한한 차이 (최대 스케일링)가있는 가우시안의 차이가 정확히 같다는 것을 알 수 있습니다.
Cris Luengo

1
1980 년 Marr과 Hildreth (부록 B)에서이 제품은 너비 비율을 변경하면서 장점 곡선을 기반으로 대역폭과 감도의 균형을 유지하는 "최상의 엔지니어링 근사치"라고합니다. 나는 델프트 사람들이 과거에 같은 이름으로 몇몇 작품을 만났습니다. 우연의 일치?
Laurent Duval

1
@LaurentDuval : Delft에서 박사 학위를 받았습니다. 내 이름 AFAIK를 가진 다른 사람은 없습니다. 감도와 대역폭을 기반으로 (주관적인) 최적을 얻는 방법을 알 수 있습니다. 비율이 너무 작 으면 응답이 너무 낮으며 다른 것보다 이산화 노이즈에 더 많이 의존합니다. 비율이 너무 높으면 흥미로운 필터가 아닙니다. 맞는 말이다. 감사!
Cris Luengo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.