DFT를 사용하여 이미지를 전환하는 방법을 이해하려면 몇 가지 주요 정보가 필요합니다.
첫째, 푸리에의 정리 : 아마도 연속적인 (즉, 아날로그) 사례를 먼저 보는 것이 더 쉽습니다. 함수가 있다고 상상해보십시오. g (t)라고 부릅니다. 간단히하기 위해, g (t)는 아날로그 오디오 녹음이라고하자. 이것은 연속적인 1 차원 함수이며 시간의 함수로서 순간 압력을 나타낸다.
이제 g (t)는 오디오 녹음을 표현할 수있는 방법 중 하나입니다. 또 다른 하나는 G (f)입니다. G (f)는 g (t)의 푸리에 변환입니다. 따라서 G (f) == FT (g (t))입니다. G (f)는 g (t)와 모두 동일한 정보를 갖지만 시간 도메인 대신 주파수 도메인에서 해당 정보를 나타냅니다. 푸리에 변환 (Fourier Transforms)에 대해서는 몇 가지 까다로운 세부 사항이 있습니다.
G (f)를 g (t)에 포함 된 "주파수 분포"로 생각할 수 있습니다. 따라서 g (t)가 사인파 (즉, 순수한 톤)이면 G (f)는 해당 톤의 주파수를 제외하고 모든 곳에서 0이됩니다. 이것은 아마도 G (f)가 일반적으로 복잡한 함수라는 것을 언급하기에 좋은 지적 일 것입니다. 즉, 실수와 허수의 구성 요소 또는 크기와 위상을 갖는 것으로 생각할 수있는 복소수를 반환합니다.
δ( w )δ
자 이제 벨트 아래에 연속 FT가 있습니다.
두 번째 통찰력은 다음과 같습니다. 이산 푸리에 변환은 샘플링 된 신호가 아날로그 신호이므로 푸리에 변환입니다. 이 경우 "이산"은 범위가 아니라 함수 영역 (시간 또는 주파수)의 양자화를 나타냅니다. 사운드 카드에서 얻은 샘플링 된 디지털 신호는 도메인과 범위 모두에서 양자화됩니다.
사운드 카드에서 얻은 디지털 바이트 스트림에는 마이크의 원래 연속 (아날로그) 신호에 대한 "샘플"이 포함됩니다. 샘플링 된 g (t)의 DFT를 취해도 여전히 G (f)를 얻습니다. G (f)는 g (t)에 포함 된 정보를 나타내는 다른 방법 일뿐입니다. 우리가 순종하면 나이 퀴 스트의 theorum을 우리의 이산 G (f는) 우리의 원래의 연속 신호의 모든 정보가 있어야하므로, 샘플링 된 신호 g (t)는, 원래의 연속 신호의 모든 "정보"를 포함하고 있습니다. 괄호로, G (f)는 여전히 복잡한 함수입니다.
이것은 서브 픽셀 쉬프팅의 마법이 들어오는 곳이지만,이 경우 오디오 신호가 샘플보다 적은 시간으로 오디오 신호를 쉬프트하는 것에 대해 씁니다.
이자형나는 π2
그 수단은, 우리는 (기준 시간에 우리의 오디오 레코딩을 전환 할 수 있는 간단 G (t)의 위상을 수정하여 샘플 시간의 일부를 포함하여, 우리는 선택할 양). 실제로, 그 진술은 아마도 너무 캐주얼합니다. 정량화되지 않은 샘플링 된 신호의 경우 위상을 임의로 조정할 수 있습니다 (이는 도메인의 양자화와 범위의 범위를 더 일찍 구분 한 이유 중 하나입니다). 그러나, 양자화 된 샘플링 된 신호 (예를 들어, 오디오의 바이트 스트림)에있어서, 양자화 스텝 크기 (즉, 비트 수)는 위상을 조정할 수있는 해상도를 결정한다. 역 푸리에 변환 G (f) (또는이 샘플링 된 신호의 경우 DIFT)를 선택하면 새로운 샘플 세트 g '(t) = DIFT (G (F))는 모두 선택한 양만큼 시간이 이동합니다.
이것을 픽셀에 적용한다는 것은 여기서 논의 된 1 차원 FT 대신 2 차원 FT를 사용한다는 것을 의미합니다.