PDF를 압축 할 때 최대 압축을 얻기 위해 7zip 파일을 만들 때 어떤 설정을 사용해야합니까?


15

최대 압축을 얻기 위해 7zip 파일을 만들 때 어떤 설정을 사용해야합니까? 스캔 한 이미지가 포함 된 PDF 문서를 압축하고 있습니다. LZMA2 사용을 생각하고 있지만 사전 크기, 단어 크기 등으로 무엇을 설정해야할지 모르겠습니다. 또한 LZMA 또는 PPMd가 더 나은 옵션입니까?

인터넷을 통해 일부 파일을 전송해야 (~ 200MiB) 여기에서 업로드 속도가 매우 느리므로 가능한 한 데이터를 압축하고 싶습니다. 소비되는 CPU 시간은 그리 중요하지 않습니다.

편집하다

다양한 압축 방법을 테스트 한 후 얻은 내용은 다음과 같습니다.

압축되지 않은 크기 : 25,462,686B

내 프로세서는 Intel Core 2 Due T8100이며 4GiB의 램이 있습니다.

최고의 압축은 PAQ8O 알고리즘을 사용하는 PeaZip입니다. 결과 파일 크기는 19,994,325B입니다. 사용 된 설정은 압축 수준 : 최대입니다. 불행히도 압축 속도는 약 5KiB / s이므로 데이터를 압축하는 데 1 시간 이상이 걸렸습니다.

다음은 실험적인 PAQ9O 압축기입니다. 그것을 사용하여 약 3 분 동안 20,132,660B를 얻었습니다. 불행하게도, 프로그램은 명령 줄일 뿐이며 다른 많은 프로그램이 해당 압축 알고리즘을 사용하는 것은 아닙니다. 또한 내가 사용한 설정으로 약 1.5GiB의 RAM을 사용합니다 (a -9 -c)

그 후 LZMA2를 사용한 7-Zip 9.15 베타 (2010-06-20)였다. 그것을 사용하여 약 3 분 안에 20,518,802B를 얻었습니다. 사용 된 설정은 단어 크기 273, 사전 크기 64MB이며 압축을 위해 2 개의 스레드를 사용했습니다.

이제 원래 질문으로 돌아갑니다. 제 경우에는 블록 크기가 눈에 띄는 결과를 얻지 못했습니다. 단어 크기가 커지면 일부 결과가 나타납니다. 가장 큰 단어 크기와 가장 작은 단어의 차이는 115,260B입니다. 이러한 절약 효과는 두 번의 클릭만으로 단어 크기를 변경하는 데 필요한 노력을 정당화한다고 생각합니다.

7zip 및 PeaZip에서 지원하는 다른 압축 알고리즘을 사용하여 19.8MiB에서 21.5MiB 크기의 파일을 생성했습니다.

결국 내 결론은 대부분 이미지가 포함 된 PDF 문서를 압축 할 때 이국적인 압축 알고리즘을 사용하는 데 필요한 노력이 정당화되지 않는다는 것입니다. 7zip에서 LZMA2를 사용한 압축은 최소한의 시간 내에 상당히 수용 가능한 결과를 생성했습니다.


PeaZip 사용과 다른 점은 무엇입니까? 그것은 단지 7zip과 다른 많은 툴에 대한 GUI 래퍼 일뿐입니다.
Cole Johnson

@Cole "Cole9"Johnson 음의 차이점은 필자의 경우에는 당시 GUI가 없었던 PeaZip의 "기타"도구를 사용했다는 것입니다. 내가 올바르게 기억한다면 PeaZip만이 GUI를 갖춘 PAQ8O 알고리즘을 제공했습니다.
AndrejaKo

답변:


7

PDF의 내용 (텍스트 및 이미지)은 이미 압축되어 있으므로 다시 압축하면 얻을 것이 많지 않습니다.


3
음 ... 아니. 약간의 테스트를 수행하고 24MiB의 PDF를 가져 와서 기본 설정을 사용하여 압축했습니다. 결과는 19MiB 파일이었습니다. 필자의 경우 5MiB가 중요합니다.
AndrejaKo

1
당신이 옳은 것 같습니다. 내가 한 일에 관계없이 7zip 기본값보다 훨씬 더 나은 결과를 얻을 수 없었습니다. 나는 여전히 어떤 압축이 다른 것보다 낫다고 확신합니다.
AndrejaKo

3
많은 공간을 절약 할 수 있다면 PDF 자체로 7-Zip없이 거의 모든 공간을 절약 할 수 있습니다. Acrobat의 PDF Optimizer를 통한 여행은 놀라운 일이 될 수 있습니다.
afrazier

usr의 답변을 참조하십시오-PDF (zlib)에 사용 된 압축을 되돌려 압축하여 다시 압축하고 재구성에 다시 적용 할 수 있습니다. 이것은 종종 ~ 50 %의 크기 감소를 초래
schnaader

@schnaader : 정말 흥미 롭습니다. Acrobat의 PDF Optimizer 및 MuPDF와 같은 도구를 사용하여 PDF를 볼 수있는 상태로 유지하면서 PDF를 수정할 수는 있지만 무손실로 변환 할 수있는 것도 매우 귀중하며 큰 이점으로 사용될 수 있습니다.
afrazier

8

시도 Capacity 현재를 - 처음 당신의 PDF 파일의 이미 압축 된 데이터 내부의 압축을 풉니 다. 그러면 7z는 압축되지 않은 데이터에 대해 마법을 수행 할 수 있습니다.

또한 매우 효과적이지만 매우 효율적인 것으로 확인 된 nanozip을 사용해보십시오 (PAQ 알고리즘의 압축 비율에서 400kb / s).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 파일 이름 .7z 하위 디렉토리

명령 행 실행 파일 이름에 필요한 첫 번째 단어를 조정하고 "-mpass = 15"뒤의 부분을 조정하여 파일 이름 및 포함 할 파일을 사용자 정의하십시오.

이 답변은 PDF 문서에만 국한되지 않습니다.
PPM이 아닌 LZMA를 사용합니다. 다른 변형과 호환되지 않는 변형이 너무 많아 PPM에서 멀리 떨어져 있습니다. LZMA는 호환성이보다 광범위하게 지원되므로보다 안정적으로 보입니다. 당신이 언급했듯이 "이국적인 압축 알고리즘을 사용하는 데 필요한 노력이 정당화되지 않았다"고 생각했기 때문에 PPM에서 멀리 떨어져 있습니다.


2
LZMA2는 LZMA보다 훨씬 우수하지만 64 비트 시스템에서만 (효과적) 사용됩니다.
OMY 2016 년

-3

압축 비율이 높은 sfx 파일 또는 msi 패키지를 만들 수 있으므로 lzma 압축이 가장 좋습니다. 귀하의 경우 큰 파일을 압축하지 않으므로 mp3 또는 png와 같이 파일이 압축 된 경우 차이가 매우 작습니다.

승리 아크를 시도하십시오 그것은 자유롭고 후회 압축 비율을 제공합니다

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.