Linux에서 텍스트 파일을 압축하는 데 더 나은 보관 방법은 무엇입니까?


17

내 응용 프로그램에서 텍스트 파일 인 로그를 압축해야합니다.

그 같다 bzip2gzip같은 압축비를 갖는다.

그 맞습니까?


xz (xz-tools 또는 p7zip의 7z, lzma와 매우 유사)가 가장 좋습니다. bzip2가 gzip보다 낫습니다.
osgx

답변:


5

일반적으로 bz2는 더 나은 압축률과 더 나은 복구 기능을 제공합니다.

OTOH, gz가 빠릅니다.

xz는 bz2보다 낫다고 말하지만 타이밍 동작을 모르겠습니다.


xz는 bzip2보다 느립니다.
osgx

xz는 속도가 느릴뿐만 아니라 bzip2를 압축하는 데 300MB 파일이 약 30 초가 걸렸습니다. 5 분 이상 압축 한 후 xz를 죽였습니다
Tebe

@ Копать_Шо_я_нашел 선택하는 압축 수준에 따라 크게 달라집니다. 을 사용하면 -1속도가 느리지 않지만 기본 설정을 사용하면 속도가 느려집니다.
glglgl

7

마지막 갱신 maximumcompression.com는 유월 2011입니다 (10 월 2015 년 업데이트 답)
따라서이 웹 사이트는 언급하지 않는
현재의 세계 챔피언 텍스트 압축기 :

      cmix

대회 / 벤치 마크 :

세부 정보 :
Byron Knollcmix2013 년부터 Matt Mahoney의 Data Compressioned Explained 를 기반으로 2013 년부터 libre 소프트웨어 (GPL)로 적극적으로 개발 하고 있습니다. Matt Mahoney는 또한 위의 벤치 마크 중 일부를 유지 관리 하고 명령 줄 증분 아카이브 인 ZPAQ ( WP )를 제안합니다 .


더 많은 표준 도구를 원한다면 (더 적은 RAM 필요) 다음을 권장합니다.

      lrzip

lrzip의 진화 rzip에 의해 콘 콜리 바스 . Long Range ZIPLzma RZIP의
lrzip 두 가지 이름을 나타냅니다 . 종종 (다른 인기있는 압축 도구) 보다 낫습니다 . Alexander Riccio 또한 추천 합니다.
lrzipxz
lrzip


내가 가장 좋아하는 것은 :

      zpaq

"아카이브 전문가" , 매트 마호니는 집중적에 근무하고있다 PAQ의 10 년 동안 알고리즘과 CPU / 메모리 리소스 및 압축 수준 사이의 최고의 타협을 제공합니다.

그러나, 마지막 zpaq버전은 종종 포장되지 않은 / 가능한 최근의 배포판에 :-(
나는 새로운 기계를 가지고 있고 아주 좋은 압축기를 필요로 할 때 항상 소스에서 컴파일 : https://github.com/zpaq/zpaq

clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq



0

bz2는 압축률이 높고 알고리즘은 압축 할 중복성을 찾는 옵션이 더 많습니다.

gzip은 훨씬 더 많은 도구를 사용하며 더 많은 플랫폼을 지원합니다. 더 많은 Windows 도구가 .gz 파일을 처리 할 수 ​​있습니다. http의 일부이므로 웹 브라우저조차도 이해할 수 있습니다.

Linux에는 압축 파일을 직접 작업 할 수있는 도구가 있습니다. zgrep 및 bzgrep는 압축 파일을 검색 할 수 있습니다.

리눅스에서만 압축 비율을 약간 높이기 위해 bzip2를 사용합니다.


0

xz는 bz2보다 훨씬 잘 압축되지만 시간이 더 걸립니다. 따라서 최대 압축이 목표이고 하드 드라이브의 공간이 프리미엄 인 경우 (파일 시스템을 재구성하는 동안 하나의 드라이브가 98 % 찼을 때의 경우) 스크립트를 실행하여 작업을 수행 할 수 있습니다 -휴식을 취하고 5 분 후에 다시 오십시오.

unxz는 내 경험에서 압축을 풀기 매우 빠릅니다. 이것은 매일 저에게 좋은 것입니다.

bz2는 xz보다 압축 속도가 빠르지 만 xz의 압축 결과를 달성하지 못하는 것으로 보입니다.

이러한 평가를 수행 할 수있는 유일한 방법은 일반적으로 압축 / 압축 해제 할 공통 파일 조합에 대해 벤치 마크를 실행하고 매개 변수를 변경하여 어떤 파일이 나오는지 확인하는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.