초기 경계 값 PDE의 수치 해 에서 공간에 평 행성 을 사용하는 것이 매우 일반적 입니다. 시간 이산화에서 어떤 형태의 병렬 처리 를 사용하는 것이 훨씬 덜 일반적 이며, 병렬 처리는 일반적으로 훨씬 더 제한적입니다. 나는 시간적 병렬성을 보여주는 코드의 수와 출판 된 작품을 알고 있지만 공간적 병렬성을 포함하는 것은 없다.
공간과 시간 모두에 병렬 처리를 포함하는 구현의 예가 있습니까? 출판물과 이용 가능한 코드 모두에 관심이 있습니다.
초기 경계 값 PDE의 수치 해 에서 공간에 평 행성 을 사용하는 것이 매우 일반적 입니다. 시간 이산화에서 어떤 형태의 병렬 처리 를 사용하는 것이 훨씬 덜 일반적 이며, 병렬 처리는 일반적으로 훨씬 더 제한적입니다. 나는 시간적 병렬성을 보여주는 코드의 수와 출판 된 작품을 알고 있지만 공간적 병렬성을 포함하는 것은 없다.
공간과 시간 모두에 병렬 처리를 포함하는 구현의 예가 있습니까? 출판물과 이용 가능한 코드 모두에 관심이 있습니다.
답변:
PFASST 및 (시간과 공간에 병렬 전체 근사 계획) PEPC은 (꽤 효율적인 병렬 쿨롱) 알고리즘은 최근 시간과 공간 모두에서 병렬 처리를 달성하기 위해 함께 사용되어왔다.
PFASST는 시간 병렬 처리를, PEPC는 공간 병렬 처리를 수행합니다. 이 결과는 최근 DD21 회의 에서 발표되었으며, 우리는 PFASST + PEPC의 조합을 설명하는 SC12 제출을 준비했습니다 .
4 백만 개의 입자 (PEPC는 병렬 N- 바디 솔버)로 구성된 "작은"문제는 PEPC 만 사용하여 JUGENE 에서 최대 8192 코어까지 잘 확장되는 것으로 나타났습니다 (즉, 공간에서 평행). 이 외에도 통신 비용이 크게 증가하고 병렬 효율성이 저하되기 시작했습니다. PFASST를 추가하면 32 개의 "시간"프로세서 (각각 8192 개의 "공간"코어로 구성됨)를 사용하여이 고정 된 크기의 문제를 262,144 개의 코어 (즉, JUGENE를 채운)에서 실행할 수 있습니다.
시간 병렬 알고리즘의 병렬 효율성은 100 %는 아니지만이 PFASST + PEPC 구성으로 32 개의 PFASST 프로세서를 사용하여 약 6.5 배의 속도 향상을 얻을 수있었습니다.
다음은 프리 프린트에 대한 링크입니다. 대규모 시공간 병렬 N-body 솔버
시공간 DG 및 연속 Galerkin 방법도 있습니다. 구적법을 선택한 후, 시간 방향으로 구조화 된 그리드를 가진 시공간 DG는 암시적인 Runge-Kutta 방법과 같습니다. 그러나 시공간 DG 방법은 암시 적 RK 방법을 분석하기 어려운 경우에 도메인의 다른 부분에서 다른 단계 크기를 허용합니다. 이 문맥에서 시공간 멀티 그리드 방법을 적용 할 수도 있습니다.
시공간 병렬 시뮬레이션을 고려하면 하위 도메인은 여러 시간 레벨에 걸친 시공간 시간입니다. 파형 완화라는 방법은 시공간 하위 도메인을 이용하지만 공간에서만 병렬화합니다 (시간 차원의 파티션 없음). 따라서 공간 분할 및 시분할의 직교는 일종의 시공간 병렬 처리를 제공합니다. 이러한 직교 방법에 대한 논문은 여기 에서 찾을 수 있습니다 . Jed Brown이 그의 답변에서 언급했듯이 시공간 방법은보다 유연한 병렬 시뮬레이션을 제공 할뿐만 아니라 이산화에 대한 적응성을 제공합니다. 후자의 주제에서 Schwab의 Google 작품을 볼 수 있습니다 . 프로젝트 도 참조하십시오 . 병렬성과 적응성을 모두 활용하는 작업은 R. Haynes 홈페이지 에서 볼 수 있습니다 .
Parareal 알고리즘과 스펙트럼 지연 보정과 같은 관련 작업을 살펴보십시오 (간단한 Google 검색으로 많은 자료가 나타남). 기본적인 아이디어는 시간에 거친 "메쉬"를 사용하고 시간을 거칠게하는 것이지만 다시 돌아가서 더 미세한 시간 단위로 수정을 수행하는 것입니다. 유체 시뮬레이션에서 주로 사용되는 것 같지만 전자기 영역에 있기 때문에 더 자세히 말할 수는 없습니다. 내가 아는 유일한 이유는 지연된 수정 접근법에 대한 세미나에 참석했기 때문에 모든 종류의 병렬 처리가 제 시간에 이루어질 수 있다는 것이 매우 흥미로워 보입니다.