2.80 GHz의 Intel® Pentium® CPU G640 및 8GB RAM이 장착 된 PC가 있습니다. EXT3 파일 시스템으로 Scientific Linux 6.5를 실행하고 있습니다.
이 설정에서 sort -u
200 기가 바이트 파일 에서 가장 빠른 방법은 무엇 입니까?
파일을 더 작은 파일 (8GB보다 작은 파일) sort -u
로 분할하고 함께 모은 다음 다른 크기로 sort -u
다시 분할해야 합니까? 아니면 제한된 양의 RAM으로 파일을 처리 할 수있는 정렬 스크립트, 프로그램이 있습니까?
parallel
moreutils보다는 GNU가 필요 하다고 생각 parallel
합니다.
sort(1)
공간이 부족할 수 있습니다 /tmp
. 그렇다면 환경 변수를 사용하여 임시 파일을위한 다른 영역을 지정 TMPDIR
하거나 플래그를 지정할 수 있습니다.-T=<tmpdir>
/tmp
.