희소 푸리에 변환이란 무엇입니까?


46

MIT는 최근 특정 알고리즘에서 작동하는 더 빠른 푸리에 변환 (Fourier Transform)으로 선전 된 새로운 알고리즘에 대해 약간의 소음을 내고있다 . MIT Technology Review 잡지 다음과 같이 말합니다 .

희소 푸리에 변환 (SFT)이라고하는 새로운 알고리즘을 사용하면 데이터 스트림을 FFT보다 10 ~ 100 배 빠르게 처리 할 수 ​​있습니다. 우리가 가장 중요하게 생각하는 정보가 많은 구조를 가지고 있기 때문에 속도가 향상 될 수 있습니다. 음악은 랜덤 노이즈가 아닙니다. 이러한 의미있는 신호는 일반적으로 신호가 취할 수있는 가능한 값의 일부만 갖습니다. 이에 대한 기술적 인 용어는 정보가 "희소"하다는 것입니다. SFT 알고리즘은 가능한 모든 데이터 스트림에서 작동하도록 설계되지 않았기 때문에 다른 방법으로는 사용할 수없는 특정 바로 가기가 필요할 수 있습니다. 이론적으로 희소 신호 만 처리 할 수있는 알고리즘은 FFT보다 훨씬 제한적입니다. 그러나 전기 공학과 컴퓨터 과학 교수 인 공동 창업자 인 카타 비 (Katabi)는“평 안함은 어디에나있다”고 지적했다. "그것은 자연이다; 그것은 비디오 신호에서의 s; "오디오 신호입니다."

여기 누군가 알고리즘이 실제로 무엇이고 어디에서 적용 가능한지에 대한 기술적 설명을 제공 할 수 있습니까?

편집 : 일부 링크 :

답변:


40

NkNNkkk

kNkO(nlogn)O(klogn)

kkO(klognlognk)

결과 의 한 그래프 (아래 이미지에서 재현)에 따르면 FFTW (MIT의 다른 사람이 만든 최적화 된 FFT 라이브러리)와 관련하여 성능 향상을위한 교차점은 에 불과합니다.12111210Nk[2000,106]

여기에 이미지 설명을 입력하십시오

이러한 조건은 신호 스펙트럼에서 상당히 큰 피크가 거의 없을 것으로 알고있는 경우 알고리즘의 적용 가능성을 제한합니다. 웹 사이트에서 인용 한 한 가지 예 는 이미지 및 비디오 압축에 자주 사용되는 8x8 픽셀의 픽셀 블록이 주파수 영역에서 거의 90 % 희소하므로 해당 속성을 이용하는 알고리즘의 이점을 얻을 수 있다는 것입니다. 그 희소성 수준은이 특정 알고리즘의 응용 프로그램 공간과 정사각형이 아닌 것처럼 보이므로 단지 예일 수도 있습니다.

그러한 기술이 실제 문제에서 사용하기에 얼마나 실용적인 지에 대한 더 나은 느낌을 얻으려면 문헌을 조금 더 읽어야하지만 특정 클래스의 응용 프로그램에는 적합 할 수 있습니다.


2
기본적으로 손실이 많은 FFT입니까? MP3 인코더처럼?
endolith

3
kk

나는 그것이 goertzel 알고리즘 (또는 그 계열)에 대해 어떻게 올라가는 지 궁금합니다. goertzel에서 당신이 찾고있는 것을 아는 유일한 차이점이 있습니다.
Spacey

5
@endolith : 계수가 양자화되기 때문에 MP3 압축이 ​​손실됩니다. 최고 k 계수 만 유지되기 때문이 아닙니다. 스파 스 FFT = "입력 신호와의 차이를 최소화하는 k- 계수 표현은 무엇입니까?" mp3 프레임의 코딩 = "계수 및 스케일 팩터를 저장하기 위해 N 비트의 예산이 주어지면 (지각 적) 에러를 최소화하는 양자화 된 계수 및 양자화 레벨은 무엇입니까?"
pichenettes

1
그들이 버려 질 때, 이것은 양자화의 부작용입니다 (값은 0으로 반올림 됨)
pichenettes

7

나는 sFFT에 대한 논문을 읽지 못했지만 FFT를 뒤로 고정한다는 아이디어는 이전의 k-sparsity를 활용한다는 생각입니다. 그러므로, FFT 계수의 모든 엔트리를 계산할 필요는없고, 대신 이들의 k만을 계산할 필요가있다. 따라서 k 스파 스 신호의 경우 복잡도가 기존 FFT의 O (nlog n) 대신 O (klog n)입니다.

@rcmpton의 의견과 관련하여 "압축 감지의 기본 개념은 다른 도메인에서 추출한 희소 무작위 샘플에서 희소 데이터를 복구 할 수 있다는 것입니다 (예 : 임의 희소 주파수 데이터 (예 : MRI)에서 희소 이미지 복구) " 문제는 "희소 랜덤 샘플"이란 무엇입니까? 희소 데이터를 일부 하위 (측정) 하위 공간에 무작위로 투영하여 수집 한 샘플 일 수 있다고 생각합니다.

내가 이해 한 것처럼 압축 감지의 이론적 프레임 워크는 주로 3 가지 문제, 희소성, 측정 및 복구로 구성됩니다. 희소성으로, 그것은 사전 학습의 과제 인 특정 클래스의 신호에 대한 희소 표현을 찾는 것과 관련이 있습니다. 측정에 의해, 랜덤 가우시안 매트릭스, 구조화 된 랜덤 매트릭스와 같은 측정 매트릭스 설계 작업 인 데이터 (또는 측정 공간을 낮추기 위해 데이터를 투영)를 측정하기위한 효율적인 방법 (계산 효율 및 복구 가능)을 찾는 것과 관련이 있습니다. ... 그리고 회복에 의해 희소 한 정규 선형 반전 문제, l0, l1, l1-l2, lp, l-group, blabla ..., 그리고 결과 알고리즘은 다양합니다. 매칭 추적, 소프트 임계 값, 하드 임계 값, 기초 추적, 베이지안, ....

"cs는 L1 규범의 최소화"이고 L1 규범은 cs의 기본 원칙이지만 cs는 L1 규범의 최소화 일뿐입니다. 위의 3 개 부품 외에도 구조적 희소성이 활용되는 구조적 (그룹 또는 모델) 압축 감지와 같은 일부 확장 기능도 있으며 복구 능력을 크게 향상시키는 것으로 입증되었습니다.

결론적으로 cs는 이론을 샘플링하는 데있어 큰 단계이며, 신호가 충분하지 않다면 신호 를 효율적으로 샘플링 할 수 있습니다. 따라서 cs는 샘플링 이론 입니다. 분류 또는 인식을위한 기술로 사용하려는 사람은 원칙을 오도합니다. 때로는 "압축 감지 기반 ....."이라는 제목의 논문이 있는데, 이러한 논문의 원리는 cs 대신 l1- 최소화를 활용하고 있으며 "l1- 최소화 기반 ..."을 사용하는 것이 좋습니다. ".

내가 틀렸다면, 정정하십시오.


DSP.SE에 오신 것을 환영합니다 이것은 큰 공헌입니다.
Phonon

6

나는 논문을 살펴 보았고 그 방법에 대한 일반적인 아이디어를 얻었다 고 생각합니다. 이 방법의 "비밀 souse"는 주파수 영역에서 입력 신호의 스파 스 표현을 얻는 방법입니다. 이전 알고리즘은 지배적 인 희소 계수의 위치에 대해 일종의 무차별 힘을 사용했습니다. 이 방법은 대신 "공간 복구"또는 "압축 감지" 위키 기사 라고하는 기술을 사용합니다. 여기에 사용 된 정확한 스파 스 복구 방법은 지배적 인 스파 스 복구 방법 중 하나 인 '하드 임계 값'과 유사합니다.

스파 스 복구 / 압축 감지 및 이에 연결된 L1 최소화의 PS 기술은 최신 신호 처리 및 특히 푸리에 변환과 관련하여 많이 사용되었습니다. 실제로 최신 신호 처리를 위해서는 반드시 알아야합니다. 그러나 푸리에 변환은 스파 스 복구 문제의 해결 방법 중 하나로 사용되기 전에. 여기 푸리에 변환에 대한 반대-드문 드문 복구 있습니다.

압축 감지 개요를위한 좋은 사이트 : nuit-blanche.blogspot.com/

PPS는 이전 주석에 응답합니다-입력 신호가 정확히 희박하지 않으면 손실됩니다.

방법이 잘못되면 언제든지 수정하십시오.


FFT 용지는 압축 감지가 아닙니다. 압축 감지의 기본 개념은 다른 도메인에서 추출한 희소 무작위 샘플에서 희소 데이터를 복구 할 수 있다는 것입니다 (예 : 임의 희소 주파수 데이터 (예 : MRI)에서 희소 이미지 복구). 이렇게하면 획득 시간이 줄어들지 만 계산 비용이 증가합니다. FFT 논문은 두 도메인 모두에 모든 데이터를 가지고 있다는 점에서 다릅니다. 목표는 계산을 빠르게 수행하는 것입니다.
dranxo

압축 감지가 잘못되었습니다.
mirror2image

1
정교하게 할 수 있습니까?
dranxo

LpAx=yRmyin,m>>nwithconstraint
mirror2image

min|x|1Ax=y
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.