규모 우주 이론 이해


10

스케일 공간 이론에서, 신호 의 스케일 공간 표현 이미지 )은 다음과 같이 주어진다 : 여기서 는 매개 변수 가있는 가우스 커널 이고 는 컨볼 루션입니다. 매개 변수 를 변경하면 다소 부드럽게 이미지가 나타납니다. 결과적으로 거친 표현 (매개 변수 )에는 작은 물체 나 노이즈가 포함되지 않습니다.D = 2 L ( X , Y ; t ) = g ( X , Y , t ) * F ( X , Y ) g ( X , Y ; t ) t * t tf(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y)g(x,y;t)ttt

요점은 스케일 불변 특성 검출 방법을 찾는 것입니다. 따라서 일부 이미지의 경우 크기가 줄어든 경우 다른 노이즈 키포인트를 찾지 않고 크기가 다른 경우에도 키포인트와 같은 기능이 올바르게 감지됩니다.

  1. 논문에서 그들은 normalized 파생 상품을 사용하고 있습니다. . normalized 미분 을 사용하는 의미는 무엇입니까 , 스케일 불변성에 어떻게 도움이됩니까?δ ξ , γ - n o r m = t γ / 2 δ x γγδξ,γnorm=tγ/2δxγ

  2. 이 이미지에서 우리는 같은 위치 근처에서 다른 키포인트가 발견되었음을 알 수 있습니다 (크기가 다릅니다). 어떻게 가능합니까?

감지 된 기능

스케일 불변 특징 검출의 단계별 알고리즘을 설명 할 수 있다면, 이것은 좋을 것입니다. 실제로 무엇을합니까? 미분은 또는 로 취할 수 있습니다 . 변수에 의해 의 도함수를 취함으로써 블롭을 검출 할 수있다 . 의 파생어는 어떻게 여기에서 돕고 있습니까?t L ( x ,x,ytLt(x,y)t

내가 읽고있는 논문은 다음 과 같습니다. 자동 스케일 선택으로 기능 감지

답변:


3
  1. 정말 내가 표기가 조금 이상한 보이는, 그래서 Lindeberg의 논문을 읽은 이후 오랜 시간이되었습니다. 결과적으로 초기 답변이 잘못되었습니다. 는 스케일 수준이 아닙니다. 조정할 수있는 일종의 매개 변수 인 것 같습니다. 도함수에 의 적절한 거듭 제곱을 곱해야한다는 것은 사실입니다 . 자체가 스케일 레벨에 대응하고, 전력은에 따라 순서 도함수.t tγtt

  2. 동일한 위치에서 여러 스케일로 키포인트를 찾을 수 있습니다. 그것은 당신 이 저울 에서 국소 최대치 를 찾기 때문 입니다. 직감이 있습니다. 얼굴의 이미지를 생각해보십시오. 미세한 크기로 코에 해당하는 얼룩이 생깁니다. 코스 스케일에서 전체 얼굴에 해당하는 얼룩이 생깁니다. 두 얼룩은 같은 지점을 중심으로하지만 크기가 다릅니다.

  3. 전체 알고리즘은 다음과 같습니다.

    • 관심있는 이미지 기능 (예 : 얼룩, 모서리, 가장자리) 결정
    • 미분, 예를 들어 블랍에 대한 라플라시안과 관련하여 "감지 기능"을 정의하십시오.
    • 검출기 기능에 필요한 계산 파생물은 다양한 범위에서 작동합니다.
    • 곱함으로써 미분 응답 , 미분의 차수는 크기 감소를 보상한다. mtmγ/2m
    • 전체 공간에서 검출기 기능을 계산합니다.
    • 에서 검출기 기능의 극대값을 구합니다 .x,y,t
    • 이것들은 당신의 관심 포인트 또는 핵심 포인트입니다.

편집하다:

  1. Lindeberg는 논문에서 가 파생 상품의 정규화에 적합한 요소 임을 입증합니다 . 나는 여기서 증거를 재현 할 수 없다고 생각합니다.tγ/2
  2. 와 관련하여 파생 상품을 취하지 않습니다 . 와 대한 도함수 만 계산 하지만 다양한 범위에서 도함수 를 계산합니다. 이를 생각하는 한 가지 방법은 분산 가우스 필터를 사용하여 이미지를 반복적으로 흐리게하여 가우스 스케일 공간을 먼저 생성하는 것 입니다. 그런 다음 각 척도 수준에서 및 에 대한 도함수를 계산 합니다.x y t x ytxytxy
  3. 동일한 위치에 다른 크기의 이미지 기능이있을 수 있으므로 스케일에서 로컬 최대 값을 찾으려고합니다. 과녁 같은 동심원 이미지를 생각해보십시오. 그것은 여러 가지 규모로 라플라시안의 높은 반응을 줄 것입니다. 또는 다양한 스케일로 라플라시안에 의해 여과 된 실제 사람의 눈 이미지를 생각해보십시오. 눈동자에게는 미세한 반응, 높은 홍채의 반응은 중간 정도, 전체 눈의 거친 반응에서 높은 반응을 얻을 수 있습니다.

요점은 관심있는 기능이 어느 정도 규모인지 미리 알 수 없다는 것입니다. 모든 스케일을 봅니다.


1. 가 미분 응답을 실제로 정규화하기에 충분한 승수를 어떻게 제공합니까? 2. 최대치에 도달 하는 파라미터 를 찾기 위해 에 의한 도함수를 취 한다고 생각 했습니다. 최고의 규모를 찾기 위해. 그래서 당신이 쓰는 것처럼 전체 선택된 범위에서 로 미분을 계산 해야하는 것처럼 보입니다 . 그리고 결과적으로 ( 미분을 취함으로써 ) 다른 스케일에서 특징을 찾을 수 있습니다. 권리? t t t x , ytγ/2tttx,y
막시무스

그리고 당신이 3에서 쓴 것처럼 이상의 검출기 기능의 극대 최대 값 찾기 왜 우리는 t로 극댓값을 찾아야합니까? 해당 단계를 자세히 설명해 주시겠습니까? 실제로 에 의한 미분은 어떻게 사용됩니까? tx,y,tt
막시무스

@maximus 답변의 수정 사항을 참조하십시오.
Dima

@maximus, 전에 잘못 알았습니다. 감마는 스케일 수준이 아닙니다. 나는 대답을 수정했다.
Dima
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.