이미지의 경우 주파수 영역은 무엇을 나타 냅니까?


110

방금 이미지의 주파수 영역에 대해 배우고있었습니다.

파도의 경우 주파수 스펙트럼을 이해할 수 있습니다. 웨이브에 어떤 주파수가 있는지 나타냅니다. 의 주파수 스펙트럼을 그리면 및 임펄스 신호가 나타납니다 . 해당 필터를 사용하여 특정 정보를 추출 할 수 있습니다.cos(2πft)f+f

그러나 이미지의 경우 주파수 스펙트럼은 무엇을 의미합니까? OpenCV에서 이미지의 FFT를 찍으면 이상한 그림이 나타납니다. 이 이미지는 무엇을 의미합니까? 그리고 그 응용 프로그램은 무엇입니까?

몇 권의 책을 읽었지만 물리적 의미보다는 많은 수학 방정식을 제공합니다. 그렇다면 누구나 이미지 처리에 간단한 적용으로 이미지의 주파수 영역에 대한 간단한 설명을 제공 할 수 있습니까?


5
변환이 수행하는 작업을 이해하는 가장 좋은 방법은 간단한 입력을 역변환에 공급하여 재생하는 것입니다 .
endolith

1
Steve Eddins의이 흥미로운 설명을 참조하십시오 blogs.mathworks.com/steve/2009/12/04/…
Alessandro Jacopson

@endolith 그래! 무슨 일이 일어나고 있으며 왜 그런 일이 일어나고 있는지 완전히 이해하려면 미리 도메인에 대한 지식이 필요합니다.
SIslam

친애하는 이미지의 주파수 영역은 (dc 성분, 저주파 및 고주파수)와 같은 Hertiz의 특정 주파수에 대한 전력 강도를 와트 단위로 나타냅니다
mntaser

답변:


93

그러나 이미지의 경우 주파수 스펙트럼은 무엇을 의미합니까?

"수학적 방정식"은 중요하므로 완전히 생략하지 마십시오. 그러나 2D FFT도 직관적으로 해석됩니다. 예를 들어, 몇 가지 샘플 이미지의 역 FFT를 계산했습니다.

여기에 이미지 설명을 입력하십시오

보다시피, 주파수 도메인에는 하나의 픽셀 만 설정되어 있습니다. 이미지 영역의 결과 (실제 부분 만 표시 함)는 "회전 코사인 패턴"입니다 (가상 부분은 해당 사인이됩니다).

주파수 영역 (왼쪽 테두리)에 다른 픽셀을 설정 한 경우 :

여기에 이미지 설명을 입력하십시오

다른 2D 주파수 패턴을 얻습니다.

주파수 도메인에서 둘 이상의 픽셀을 설정 한 경우 :

여기에 이미지 설명을 입력하십시오

두 코사인의 합을 얻습니다.

따라서 사인과 코사인의 합으로 표현 될 수있는 1 차원 파와 같이, 2d 이미지는 위에서 보여진 것처럼 "회전 사인과 코사인"의 합으로 표현 될 수 있습니다.

opencv에서 이미지의 fft를 찍으면 이상한 그림이 나타납니다. 이 이미지는 무엇을 의미합니까?

추가 할 때 원본 이미지를 제공하는 사인 / 코사인의 진폭과 주파수를 나타냅니다.

그리고 그 응용 프로그램은 무엇입니까?

그들 모두를 지명하기에는 정말로 너무 많습니다. FFT를 사용하여 상관 관계 및 컨볼 루션을 매우 효율적으로 계산할 수 있지만 이는 최적화에 대한 것이므로 FFT 결과를 "보지"않습니다. 고주파 성분은 일반적으로 노이즈이기 때문에 이미지 압축에 사용됩니다.


3
주파수 영역 이미지에서 고주파 부분과 저주파수 부분을 지정할 수 있습니까?
Abid Rahman K

4
@ arkiaz : 내가 보여준 이미지에서 가장 높은 주파수는 이미지의 중앙에 있으며 가장 낮은 주파수 (즉, 입력 이미지의 평균)는 FFT 결과에서 왼쪽 상단 픽셀입니다. 이것이 대부분의 FFT 구현이 제공하는 것입니다. FFT 결과를 표시하면 가장 낮은 주파수를 표시된 이미지의 중앙으로 이동하는 것이 일반적입니다.
Niki Estner

1
@Mohammad : Mathematica의 InverseFourier기능을 사용했습니다. 옥타브 / 매트랩도 ifft2똑같이하지 않습니까?
Niki Estner

1
@JimClay 컬러 이미지의 경우 실제로 YUV 도메인을 사용하는 것이 좋습니다 . Y = 절대 강도 및 UV = 색상. 컬러 이미지의 경우에도 관심있는 대부분의 정보는 이미지의 강도 부분에 있습니다. 동일한 수학적 도구를 모두 사용하고 다시 변환해야합니다.
Atav32

4
이것들은 포인트를 움직이고 파도가 폭과 각도를 어떻게 변화시키는 지 보여주는 애니메이션처럼 훌륭 할 것입니다
endolith

29

나는 이것이 잘 알려진 "DSP 가이드"( 24 장, 섹션 5 )에 잘 들어간 것 같아

푸리에 분석은 1 차원 신호와 거의 같은 방식으로 이미지 처리에 사용됩니다. 그러나 이미지에는 정보가 주파수 영역에 인코딩되어 있지 않기 때문에 기술이 덜 유용합니다. 예를 들어, 푸리에 변환이 오디오 신호에서 취해질 때, 혼란스러운 시간 영역 파형은 이해하기 쉬운 주파수 스펙트럼으로 변환됩니다.

이에 비해 이미지의 푸리에 변환을 수행하면 공간 영역의 간단한 정보가 주파수 영역의 스크램블 형식으로 변환됩니다. 간단히 말해서 푸리에 변환이 이미지로 인코딩 된 정보를 이해하는 데 도움이 될 것으로 기대하지 마십시오.

물론 전형적인 이미지의 DFT를 취함으로써 얻은 겉보기에 임의의 패턴 뒤에 약간의 구조와 의미가 있지만 (아래 예와 같이) 인간의 두뇌가 직관적으로 이해할 수있는 형태가 아닙니다. 적어도 시각적 인식에 관한 것입니다.

임 구르

다음 은 이미지의 푸리에 변환에 포함 된 내용과 해석 방법에 대한 흥미롭고 읽기 쉬운 또 다른 설명입니다. 그것은 푸리에 변환 된 이미지와 원본 이미지 사이의 대응이 무엇인지를 분명히하는 일련의 이미지를 가지고 있습니다.

편집 : 이 페이지를 살펴보십시오. 이 페이지 는 끝 부분에서 이미지의인지 적으로 중요한 정보가 주파수 표현의 위상 (각도) 구성 요소에 저장되는 방식을 보여줍니다.

편집 2 : 푸리에 표현에서 위상과 크기의 의미에 대한 또 다른 예 : TU Delft 교과서 " 이미지 처리의 기본 "의 "3.4.1 절, 위상과 크기의 중요성" 은이를 명확하게 보여줍니다.

임 구르


야! 귀하의 질문에 대한 두 번째 링크 ( "또 다른 흥미롭고 읽기 쉬운 박람회 ..." )를 따르려고 시도 했지만 링크가 작동하지 않습니다. 또한 의견에 제공된 링크를 시도했지만 작동하지 않습니다. 작업 링크에서 찾아서 편집 할 수 있습니까?
penelope

@ penelope 당신은 링크에 문제를 발견하는 두 번째 사람입니다 (이전 의견 참조). 실제로 페이지가 불안정한 것 같습니다. 앞에서 말했듯이 링크를 Web Archive 버전으로 교체합니다. 이것을 지적 해 주셔서 감사합니다!
waldyrious

1
실제로 (마지막으로 작동하는) 링크의 예제와 설명은 훌륭합니다 :)
페넬로프

12

파 는 1 차원 파이며; 그것은 에만 의존합니다 . 파 는 2 차원 파이다. 와 에 의존합니다 . 보시다시피, 어느 방향 으로든 두 개의 주파수가 있습니다.f(t)=cos(ωt)tf(x,y)=cos(ωx+ψy)xy

따라서, 푸리에의 (FFT) 변환 당신에게 줄 것이다 단지의 FFT처럼, 당신에게 제공 . 입력이 2D 코사인을 합한 함수 인 경우 2D FFT는 코사인의 주파수의 합이됩니다. 다시 1D FFT의 직접 아날로그입니다.cos(ωx+ψy)ω,ψcos(ωx)ω


10

푸리에 분석은 직교 함수 ( orthogonal functions) 라는 개념의 특별한 경우라는 점에 주목할 가치가 있습니다 . 기본 개념은 복잡한 신호를 더 간단한 "기본"기능의 선형 중첩으로 분류하는 것입니다. 기본 기능에 대한 처리 또는 분석을 수행 한 다음 기본 기능에 대한 결과를 합하여 원래 신호의 결과를 얻을 수 있습니다.

이것이 작동하기 위해서는 기본 함수에 대한 특정 수학 요구 사항이 있습니다. 푸리에 변환의 경우 기본 함수는 복잡한 지수입니다. 그러나이를 위해 사용할 수있는 다른 기능이 많이 있습니다.


사실입니다. 어떤 다른 유형의 기본 기능이 있습니까? 나는 daubechies 잔물결을 생각하고 있지만 다른 것들도 있습니까? 그것들을 무엇으로 구별 할 것인가?
Spacey

아마도 가장 잘 알려진 것은 다항식입니다. 함수를 다항식 집합으로 표현하는 것을 테일러 세리라고 합니다. 이 세리는 함수 파생물로부터 쉽게 계산됩니다.
MSalters

2
기본 기능을 찾는 한 가지 방법은 주성분 분석을 적용하는 것 입니다. 결과 '고유 이미지'는 종종 sin / cos 기능보다 인간이 직관적으로 보입니다. 예를 들어, 고유 면을 참조하십시오 . 주파수 영역은 여전히 ​​지각과 관련이 있습니다 (우리의 눈 / 뇌에는 특히 움직임이 관련 될 때 주파수에 민감한 에지 검출기가 있습니다). 기본 기능은 이미지만큼 의미가 없습니다.
Dan Bryant

PCA는 널리 이해되는 훌륭한 기본 계산 기술이지만 데이터 생성 방법에 대해 다른 가정을하는 다른 기술도 많이 있습니다. ICA (Independent Component Analysis)가 널리 사용되는 예입니다. 조금 더 나아가, 희소 코딩 (예를 들어, J Mairal et al., "희소 코딩을위한 온라인 사전 학습", ICML 2009)을 사용한 일반 기반 함수 학습을위한 알고리즘이 있고, 딥 넷에 의해 개발 된 "기능 학습"접근법이있다. 여러분.
lmjohns3 3

1
함수가 직교해야하는 이유는 무엇입니까?
quantum231

8

이미지에서 주파수가 증가하면 밝기 또는 색상의 급격한 전환이 발생합니다. 또한 노이즈는 일반적으로 스펙트럼의 하이 엔드에 내장되어 있으므로 저역 통과 필터링을 사용하여 노이즈를 줄일 수 있습니다.


1
갑작스런 전환이 때때로 노이즈로 간주된다는 것을 의미합니까?
Abid Rahman K

1
예, 가끔 요 일반적인 예로는 모기 소음 (가장자리 주변에서 울림), 매크로 블록 가장자리에서 JPEG 블록 소음 및 그레인이 있습니다. 간단한 그라디언트 이미지를 고려하십시오. 이 이미지에 그레인을 추가하면 이미지 전체에 미세한 전환이 발생하여 고주파 성분이 증가합니다.
Emre

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.