MS Word에서 생성 된 PDF가 왜 그렇게 큰가요?


70

이 문장 만 포함 된 간단한 MS Word 문서를 만들었습니다.

이것은 작은 문서입니다.

다른 건 없어 그런 다음이 문서를 DOCX 및 PDF로 저장했습니다. 파일 크기는 다음과 같습니다.

DOCX : 12kB
PDF : 89kB

이 차이는 기술적 으로 엄청 나며 , DOCX에서 수십 kB 인 대부분의 텍스트 문서 가 수백 kB의 PDF를 생성하기 시작할 때 실제로 귀찮게 시작 합니다. PDF 형식에서 비효율적 인 것은 무엇입니까? 아니면 끔찍한 출력 알고리즘을 사용하는 Word입니까?

BTW, PDF 출력 설정은 가능한 가장 작은 파일을 만들도록 설정되었습니다.

PDF 출력 옵션


28
내 생각에 PDF에 글꼴이 포함되어있어 문서를 실제로 이식 할 수 있어야합니다.
AFH

2
예, 글꼴 하위 세트가 포함되어 있습니다. 그럴 수도 있습니다. 나는 같은 문장을 몇 백 번 반복하려고 시도했으며 PDF 파일 크기는 4kB만큼 커졌습니다. (DOCX 그 압축 된 형식과 거의 새로운 바이트를 취할 것 반복 텍스트와 같이 놀라운 일이없는 12KB에 머물렀다.)
보렉 버나드

1
@AFH Arial을 포함하지 않습니다. i.stack.imgur.com/aUZgt.png
MonkeyZeus

1
Kolmogorov의 복잡성 관점에서 볼 때 Microsoft Word는 평균 PDF 뷰어보다 훨씬 수백 kB 이상 더 큽니다.
hobbs

8
나는 ... 당신의 워드 프로세싱 형식에 해당하는 LaTeX의 것보다 훨씬 더 큰 이유 진짜 질문은 생각 - P
토비 Speight에게

답변:


104

메모장 ++에서 PDF를 열면 다음을 찾을 수 있습니다.

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

해당 객체는 / FontFile2 명령어의 끝에서 여기에 참조됩니다.

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Word 문서에서 사용하는 글꼴은 PDF에 포함되므로 pdf는 자체 포함됩니다.

이 슬라이드 데크 를 사용 하여 PDF 지침을 해독했습니다.

글꼴이 PDF 파일에 포함되지 않도록하려면 Word 문서가 PDF 뷰어에서 사용할 수있는 14 가지 표준 서체 중 하나를 사용하는지 확인하십시오 (출처 Wikipedia )

  • Times New Roman> Times (v3) (일반, 기울임 꼴, 굵게 및 굵게 기울임 꼴로 표시됨)
  • Courier New> Courier (일반, 비스듬한, 굵은 체 및 굵은 체 비스듬한)
  • Arial> Helvetica (v3) (일반, 기울기, 굵게 및 굵게 기울임)
  • 심볼> 심볼
  • 날개> Zapf Dingbats


2
참고 사항 : 연결된 슬라이드 데크 (Powershell 프레젠테이션)는 읽을 가치가 있습니다. 매우 상세합니다. 그가 PDF의 구조를 설명하는 주석을 놓치지 마십시오
nixda

3

간단한 원고를 PDF로 내보내려고 할 때 Microsoft Word에서 여러 번 발생했습니다. 크기가 최대 50KB 인 5–8 페이지의 Word 문서는 10MB 이상의 PDF 파일로 끝나며,이 파일은 너무 커서 누군가에게 전자 메일을 보내기에는 너무 큽니다.

Rene의 대답 은 올바른 길에 있습니다. 문제는 글꼴이 문서에 포함되어 있다는 것입니다. 그러나 표준 서체 중 하나만 사용한다고해서 반드시 문제가 해결되는 것은 아닙니다.

내 모든 문서는 대담하고 이탤릭체보다 더 멋진 것을 사용하여 Times New Roman에있었습니다. 또는 나는 생각했다. 기본 템플릿에서 자동 커닝을 사용하도록 설정 한 것으로 나타났습니다 ( 확실한 이유로 ). PDF로 내보낼 때 Word는 실제로 각 합자를 문서에 별도의 글꼴 개체로 포함시켜 모든 믿음을 초월합니다.

수정은 간단합니다. 매번 수정해야합니다.

  1. 문서에서 모든 텍스트를 선택하십시오.
  2. 형식 → 글꼴 → 고급
  3. "글꼴 확인"을 선택 해제하십시오.

흥미롭게도 합자, 상황에 맞는 대안 및 기타 고급 타이포그래피 기능을 사용할 수 있습니다. 결과 PDF 크기에 영향을 미치지 않습니다.

문서를 PDF로 다시 내 보내면 100KB 정도입니다. 불행히도 커닝은 하위 수준 이므로이 방법으로 인쇄하는 것은 좋지 않지만 문서를 전자 메일로 보내는 데는 효과적입니다.


-3

도움이 될 수있는 기술적 해답을 줄이려면 PDF는 벡터 (예 : 수학 방정식)를 사용하여 모든 것을 설명합니다. 모든 곡선과 선은 수학 방정식으로 정의되므로 특히 문서에 이미지가있는 경우 많은 정보를 보유해야합니다.

이것의 장점은 선과 곡선의 너비가 없기 때문에 해상도 나 디테일을 잃지 않고 이론적으로 무한대로 확대 할 수 있다는 것입니다.

Google의 최근 글꼴 변경으로 로고 크기가 ~ 14KB에서 ~ 300B로 감소한 것처럼 글꼴이 단순하면 파일 크기를 줄이는 데 도움이 될 것입니다.


4
그 비유가 작동하지 않습니다. 조금도. Google의 로고 변경은 글꼴 일뿐 아니라 그라디언트에서 플랫으로 크기가 달라졌습니다. 또한 문서를 큰 비트 맵으로 내 보내면 글꼴 + 텍스트보다 훨씬 큽니다. 오해의 소지가있는 수학 방정식은 정수 좌표 쌍이며 글리프 당 수십 개가있을 수 있습니다. 그리고 글꼴이기 때문에 모든 문자에 대해 반복 할 필요가 없습니다.
Joey
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.