미리보기로 저장할 때 PDF 파일 크기가 증가하는 원인은 무엇입니까?


17

미리보기에서 PDF 파일을 편집하거나 주석을 달거나 열기 만하면 파일 크기가 크게 증가하는 것으로 보입니다. 스캔 한 일부 책의 경우 페이지 렌더링 시간이 향상되는 것으로 나타났습니다.

이 변화를 일으키는 일에 대해 어느 누구도 밝힐 수 있습니까? Preview와 iPad (아마도 GoodReader)간에 PDF ebook의 주석을 동기화하는 데 관심이 있지만 큰 PDF 파일에서는 너무 비실용적 일 수 있습니다.


2
미리보기에서 PDF를 인코딩하기로 결정한 방법 때문일 수 있습니다. PDF가 이제 공개 형식이지만 모든 사람이 동일한 방식으로 인코딩하고있는 것은 아닙니다. 가장 안전한 방법은 Adobe PDF 편집기를 가져 와서 사용하는 것입니다. 이러한 사람들 인 discussions.apple.com/thread/3896311?start=0&tstart=0 에 따르면 차이가 있습니다. 또한 문제의 가능한 원인에 대해서도 논의합니다.
Tony

답변:


12

레오 톨스토이 (Leo Tolstoy)는 그의 작은 소설 인 PDF Karenina 에서 다음과 같이 썼다.

최적으로 인코딩 된 PDF 파일은 모두 비슷합니다. 차선으로 인코딩 된 모든 PDF 파일은 자체적으로 차선으로 인코딩됩니다.

이유는 대답 누군가를 위해 열심히 당신의 PDF 파일은 미리보기 수정 그 후 더 크다. PDF 파일은 이미지, 컨텐츠 스트림, 글꼴, 문서 오버 헤드, 색상 공간, 확장 된 그래픽 상태 및 상호 참조 테이블 등 여러 가지 종류의 데이터로 구성됩니다. 한 문장은 간결하고 다른 문장은 같지만 둘 다 유효한 영어이고 같은 말을하므로 한 PDF 파일도보다 간결한 PDF 파일과 동일한 내용을 표현하는 더 자세한 방법을 가질 수 있습니다. 정확한 PDF 파일을 봐야합니다. 그것들은 다양한 다른 소프트웨어 조각으로 만들어 졌을 것입니다.

또한 미리보기에서 다른 이름으로 저장을 수행 할 때 새 PDF 파일을 작성하는 소프트웨어를 결정하므로 사용중인 Mac OS X 및 미리보기 버전도 중요합니다.

그러나 나는 몇 가지에 대한 커질수록 무엇을 말할 수있는 PDF 파일. 이 이야기는 Mac OS X 10.5.8 및 Apple Preview 4.2 (469.5)를 실행하는 내 컴퓨터에 적용됩니다.

하나의 파일 ( Giulio.pdf)은 스캔 이미지가 아닌 텍스트를 텍스트로 포함하는 22 페이지의 문서입니다. 461,092 바이트입니다. 미리보기에서 파일을 열고 파일 ... 다른 이름으로 저장 ... 을 수행 한 후 새 파일 이름으로 저장했습니다. 새 파일은 724,421 바이트 또는 57 % 더 큽니다.

Mac OS 용 Adobe Acrobat Professional 버전 8.3.1로 각 파일을 열었습니다. 내가 한 고급 ... PDF 최적화 ... 감사 공간 사용을 ... . 작은 대화 상자는 각 사용 범주로 인한 바이트 수와 범주에 대한 총 파일 크기의 백분율을 세분화했습니다.

원본의 Giulio.pdf콘텐츠 스트림은 390,754 바이트 (84.75 %), 이미지는 0 바이트입니다. PDF 1.4 형식입니다. Preview로 저장 한 파일은 콘텐츠 스트림 전용 675,846 바이트 (93.29 %)와 0 바이트의 이미지를 가지며 PDF 1.3 형식입니다. 미리보기는 컨텐츠 스트림을 285,092 바이트 더 크게 만들었으며이 둘은 파일 크기 차이의 73 %를 나타냅니다.

PDF 1.3 파일 형식이 이러한 종류의 파일을 저장하는 데 본질적으로 덜 효율적인지 궁금했습니다. Giulio.pdfAdobe Acrobat Professional 8에서 원본 을 열고 고급 ... PDF 최적화 프로그램 ... 호환 가능 : Acrobat 3.0 이상에서 확인을 누릅니다. 결과 파일을 새 이름으로 저장했습니다. 결과 파일은 PDF 1.3 형식이며 452,356 바이트 또는 원본보다 작습니다. 내용 스트림은 375,171 바이트 (82.94 %)로 비슷한 비율이지만 원본 파일의 내용 스트림보다 작습니다.

따라서 Mac OS X 10.5.8의 Preview 앱은 다른 PDF 제작자보다 PDF 파일로 간결한 컨텐츠 스트림을 만드는 데 비효율적이며 그 차이는 크기 차이의 3/4을 설명하기에 충분하다고 결론 지을 수 있습니다 이미지가없는 PDF 파일로

form k.pdf종이에서 스캔 한 1 페이지짜리 문서 에 대해 비슷한 실험을했습니다 . 원본 파일은 303,730 바이트이며이 중 298,197 바이트 (98.18 %)는 이미지입니다. 다른 이름으로 저장 ...을 사용하여 미리보기로 작성된이 파일의 사본은 300,601 바이트 또는 1 % 작습니다. 이 파일 크기 차이는 미리보기로 만든 파일에서 더 작은 "문서 오버 헤드"바이트 범주에 의해 설명됩니다.

따라서 미리보기로 인해 PDF 파일의 크기가 항상 커지는 것은 아니라고 결론 지을 수 있습니다. 원본 PDF 파일의 특성과 시작이 얼마나 간결한 지에 따라 다릅니다.


3

나는 이것이 매우 늦었다는 것을 알고 있지만 적어도 처음에 사용 된 경우 작동하는 것으로 나타났습니다. "파일 크기 줄이기"에 Quartz 필터를 사용해 보았습니다. 작동하는 것 같지만 기본적으로 켜져 있지 않습니다. 다른 이름으로 저장 메뉴 (보류 옵션)를 통해이를 구체적으로 선택할 수 있지만, 자동 저장에서 일반적인 방법으로 기본 설정되는 것이 걱정됩니다.

여기 저에게 일어나는 일과이 페이지를 처음에 보았습니다. PDF는 91MB 900 페이지의 책으로 시작합니다. 단일 주석을 추가하고 저장하면 파일이 최대 2.29GB로 이동합니다. 또한 외부 드라이브에 저장하기 때문에 저장하는 데 시간이 오래 걸립니다. 드라이브가 USB 3 인 것을 감사합니다!

어쨌든 이러한 주석을 추출 할 수 있습니까? iPad에서 Goodreader 및 PDF Expert에 주석을 달고 강조 표시 할 수 있습니다. 미리보기로 컴퓨터에서이 작업을 수행 할 수없는 경우 다른 앱이 있습니까? 왜 주석 / 강조 표시 만 저장할 수는 없지만 매번 JPEG를 다시 저장하는 것처럼 모든 그림을 다시 압축하려고 시도하지 마십시오. 도와 주셔서 감사합니다!


작동 : 400 KiB> 1.3 MiB> 540 KiB. 내 원본 PDF는 400 KiB 미만이었으며 몇 가지 하이라이트 / 밑줄을 추가 한 후 1.3 MiB의 괴물이되었습니다. 나는 제안대로하고 파일은 540 KiB : 다른 이름으로 저장 ... 으로 석영 필터가 파일 크기 줄이기로 설정되었습니다 . 이전 하이라이트를 계속 편집 할 수 있으며 ( PDF내보내기 ...로 불가능 함 ) 크기는 다른 장치에서 편집하여 얻는 것과 비슷합니다.
다니엘

1

문제는 여전히 심각한 문제입니다. Preview 7.0 (Mac Os 10.9.5)에서 Acrobat 9.5.5를 사용하여 pdf를 생성했습니다. 그 결과 5MB 파일이 생성되었습니다. 미리보기에서 정확히 12자를 추가했습니다 (편집 도구 사용). 이 파일을 저장 한 후 14MB로 줄었습니다.

Acrobat에서 열고 다시 저장하여 문제를 해결할 수 있습니다 ( "파일 크기 줄이기"옵션을 사용해야 할 수도 있음).


2
이것이 일어나는지 설명하지 않습니다 .
Ian C.

0

솔루션에 단서를 추가 할 수 없습니다. 비슷한 시나리오 (OS X 10.11.3)를 추가 할 수 있습니다. ~ 800kb로 측정 된 스캔 된 PDF가 미리보기에서 열리고, 비어있는 스캔 된 페이징 된 두 페이지가 삭제되고, 결과적으로 2 페이지 더 짧은 pdf는 ~ 2,2Mb입니다. "옵션으로 저장"및 "파일 크기 줄이기"쿼츠 필터를 선택하면 파일이 1,9Mb로 압축됩니다.

원본 파일은 Xerox WC 7830 복사기에 의해 생성되었으며, 필자의 경험 (이전의 다기능 프린터 / 복사기 기계와 비교하여)은 매우 최적화 된 스캔 PDF를 생성합니다.

시각적으로 파일의 차이를 볼 수 없습니다. 나는 것 같아요 원본 파일이 훨씬 적은 색 심도를 사용 클리 어리 반면, 이미지가 24bpp에서 재 압축되고있는 페이지를 가능성이 6 비트 (그것은 인쇄 및 문서에 서명, 텍스트 만 스캐너는 유지의 좋은 일을 만드는 것 흰색 배경 순백색). 안타깝게도 미리보기는이를 감지하고 유지하기에 영리하지 않으며 나머지 페이지에서 아무런 변경 사항이 없어도 전체 파일을 다시 압축해야하는 것처럼 보입니다 (다시 두 페이지 만 삭제됨).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.