몇 년 동안 HDF5를 사용해 왔지만 데이터 세트의 크기가 커짐에 따라 여기에 나열된 것과 동일한 문제가 발생하기 시작합니다.
http://cyrille.rossant.net/moving-away-hdf5/
병렬 쓰기 지원-거대한 매트릭스의 청크 액세스 지원
내 일반적인 사용 사례는 100k x 100k 정수 행렬입니다. 논리적 관점에서 전체 파일로 사용하고 싶지만 병렬 작업자와 함께 덩어리로 덩어리를 작성해야합니다.
3
어떤 종류의 데이터 세트를 내 보내야하는지 설명해 주시겠습니까? 이것은 귀하의 질문에 대답하고자하는 사람들에게 도움이 될 수 있습니다. netcfd뿐만 아니라 HDF5도 고려했습니다. 그러나 이들은 특정 데이터 세트에 더 적합 할 수 있습니다.
—
찰스
압축 된 VTK는 청크를 지원합니다. 병렬로 많은 파일을 저장하고 PVD 메타 파일을 사용하여 함께 병합 할 수 있습니다. 데이터 세트의 크기는 얼마입니까?
—
Krzysztof Bzowski
편집 후 청크 된 VTK는 좋은 결정이 아닙니다.
—
Krzysztof Bzowski
무엇을 사용하게 되었습니까?
—
aidan.plenert.macdonald
@ aidan.penert.macdonald MPI로 병렬 쓰기를 사용하여 hdf5로 유지했습니다. 그러나 나는 파이썬을 포기해야했다
—
MG