사소하게 병렬화 할 수있는 응용 프로그램이 있지만 성능은 I / O 범위가 큽니다. 응용 프로그램은 일반적으로 크기가 2-5GB 인 파일에 저장된 단일 입력 배열을 읽습니다 (그러나이 숫자는 나중에 커질 것으로 예상합니다). 일반적인 계산은 해당 배열의 각 행 또는 열에 동일한 작업을 적용합니다. CPU를 많이 사용하는 작업의 경우 최대 약 100 개의 프로세서로 확장 할 수 있지만 속도가 느린 작업의 경우 I / O 및 관련 통신 (NFS 액세스)이 지배적이며 몇 개 이상의 프로세서를 효율적으로 사용할 수 없습니다.
이러한 상황에서 효율적이고 이식 가능한 (이상적으로 이식 가능) 옵션은 무엇입니까? Parallel HDF5가 유망한 것 같습니다. 누구든지 실제 경험이 있습니까?
MPI-I / O가 조사 할만한 가치가 있습니까? 주어진 파일 레이아웃으로 효율적으로 작동합니까, 아니면 모든 것을 조정해야합니까?