고속 푸리에 변환 (FFT)의 확장 성


12

예를 들어 PDE 솔버와 관련하여 균일하게 샘플링 된 데이터에 FFT (Fast Fourier Transform)를 사용하려면 FFT가 ) 알고리즘 이라는 것이 잘 알려져 있습니다. n (즉, 매우 큰)에 대해 병렬로 처리 할 때 FFT 스케일이 얼마나 잘 됩니까?O(nlog(n)n


1
조금 혼란 스러워요. 데이터 포인트 수가 증가함에 따라 고정 된 수의 프로세서에 대해 실행 시간이 확장되는 방법, 프로세서 수가 증가함에 따라 고정 된 수의 데이터 포인트에 대해 실행 시간이 확장되는 방법 또는 데이터 포인트 수가 증가함에 따라 프로세서 당 데이터 포인트의 고정 비율은?
제프 옥스 베리

약하고 강한 스케일링.
Allan P. Engsig-Karup

답변:


8

이것은 입증 된 증거보다 더 많은 일화적인 증거이지만 FFTW 와 같은 FFT에 대한 기존 구현은 스케일링 능력에 한계가있는 것으로 보입니다.

kO(107)

그러나 여기서의 가정 메시지는 FFT가 확장되어야한다는 것입니다. 그러나 알고리즘 성능의 이론적 고려에서 실제 HPC 플랫폼에서의 실제 구현으로 이동할 때 예상치 못한 제한과 상호 작용이 발생하는 경우가 있습니다.



5

ndd

Google Scholar에서 "병렬 FFT"또는 "의사 스펙트럼 확장 성"을 검색하면 평가할 자격이없는 풍부한 정보가 생성됩니다. 그러나 이것은 실제로 달성 할 수있는 것에 대한 최근의 좋은 예처럼 보입니다.

유체 난류에 대한 확장 가능한 병렬 의사 스펙트럼 계산을위한 하이브리드 MPI-OpenMP 체계

요약:

분산 메모리 병렬 처리에 MPI를 사용하고 공유 메모리 병렬 처리에 OpenMP를 사용하는 하이브리드 체계가 제공됩니다. 이 연구는 떠오르는 페타 스케일, 코어 수, 대규모 병렬 처리 시스템에서 유체 난류의 유사 스펙트럼 계산에서 예외적으로 높은 레이놀즈 수를 달성하려는 욕구에 의해 동기가 부여됩니다. 하이브리드 구현은 잘 테스트 된 확장 가능한 MPI 병렬화 된 의사 스펙트럼 코드에서 파생되고 확장됩니다. 하이브리드 패러다임은 의사 스펙트럼 그리드의 도메인 분해에 대한 새로운 그림으로 이어지며, 이는 무엇보다도 병렬의 고속 푸리에 변환에 필요한 글로벌 데이터의 3D 전치를 이해하는 데 도움이됩니다. 수치 이산화. 하이브리드 구현의 세부 사항이 제공됩니다. 성능 테스트는이 방법의 유용성을 보여줍니다. 하이브리드 방식은 최대 평균 효율 83 %로 최대 ~ 20000 컴퓨팅 코어에 가까운 이상적인 확장 성을 달성 함을 보여줍니다. 서로 다른 두 플랫폼에서 코드 성능을 최적화하기 위해 최적의 MPI 프로세스 수와 OpenMP 스레드를 선택하는 방법을 보여주는 데이터가 제공됩니다.


1

O(n)

O(logn)

O(n)


1
FFT에는 상당한 양의 통신이 있지만 단일 노드에서 결과를 수집 할 필요는 없습니다. FFT의 가장 일반적인 사용은 난류의 직접적인 수치 시뮬레이션에서 실제 공간에 비선형 대류 항을 적용하는 데 사용되고 나머지 시뮬레이션은 푸리에 공간에서 수행됩니다. 이것은 결과를 직렬화 할 필요가 없습니다. 병렬 컴퓨팅의 경우 일반적으로 "큰"데이터는 항상 분산 형식으로 저장 및 분석해야합니다.
Jed Brown
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.