기수 -4 FFT 대 기수 -2


10

기수 -4 구현은 동등하게 코딩 된 기수 -2 FFT보다 빠릅니까? 그렇다면 왜 더 빠를까요?

답변:


5

때에 따라 다르지. 기수-4는 나비 수의 1/4이며 나비 당 3 mpy + 8 추가 (적절하게 구조화 된 경우)와 기수 2는 나비 당 1 mpy + 2 추가이므로 이론적으로 기수-4로 곱셈을 저장할 수 있습니다 .

따라서 곱하기 측면에서는 조금 낫지 만 코드 구조, 예외 처리, 계수 관리, 레지스터 관리, 숫자 역 주소 지정 등의 측면에서 복잡성이 더 높습니다.

따라서 mpy의 수가 요즘 대부분의 하드웨어에서 그렇지 않은 제한 요소 인 경우에만 이점이됩니다.


2

여기 ! FFT에 대한 두 알고리즘의 주요 차이점에 대한 설명을 찾을 수 있습니다. 문서의 끝에 데이터 크기가 증가하면 기수 -4 fft의 성능이 기수 -2보다 우수하다는 점에 주목할 수있는 일부 표가 있습니다.


2

기수 -4 FFT를 보는 간단한 방법은 하나의 기수 -4 나비를 4 개의 기수 -2 나비를 포함하는 것으로 생각하는 것입니다. 한 번에 2 개의 나비와 다음 번에 2 개의 나비. 나비에 대한 복잡한 트위들 팩터가 의 위상차에 의해 꺼져 있다는 것을 제외하고 트위들 팩터는 동일하다.π2()코사인()

곱셈과 덧셈의 수는 동일하다고 생각하지만 기수 -4 나비는 모두 프로세서 레지스터 뱅크에서 수행 할 수 있습니다 (약 16 개의 부동 소수점 레지스터가 있으며 실제 및 imag 부분에는 8 개가 필요하다고 생각합니다 4 개의 값 중, 죄와 코사인 트위들에 대한 2 개의 레지스터, 그리고 스크래치에 대한 다른 레지스터 또는 2 개). 메모리에서하는 것보다 빠릅니다.


-2

기수 2에서 표본의 수는 2의 거듭 제곱과 관련이 있지만 기수 4의 표본 수는 4의 거듭 제곱입니다.


1
알고리즘 속도에 영향을 미치는 이유를 설명하는 것이 좋습니다.이 값은 지수에서 분명하지 않습니다.
MBaz
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.