PDF 파일에서 이미지 해상도를 찾으십니까?


15

일부 사용자가 매우 큰 PDF를 작성하는 데 문제가 있습니다. 다른 한편으로 나는 정말로 작은 크기와 완전히 인쇄 가능한 팩스 기계에서 PDF를 보냈습니다. 내 질문은

  • PDF의 해상도 (DPI)를 찾을 수있는 방법이 있습니까? 인터넷을 검색했는데 답을 찾지 못했습니다. 파일의 속성을 확인 했는데이 정보는 적어도 제 경우에는 저장되지 않았습니다.
  • 텍스트 파일을 이미지 PDF로 변환하는 최적의 해상도는 무엇입니까? 96dpi, 300dpi 이상?
  • 재미있는 질문입니다. 높은 dpi로 스캔 한 PDF를 작은 dpi로 크기를 조정할 수 있습니까?

인터넷을 이미 검색 했는데도 답변을 찾지 못해 일부 답변을 사용할 수 없다는 것을 알고 있습니다.

참고 : 내 PDF는 전적으로 이미지이며 텍스트는 이미지입니다. 나는 또한 당신이 실험 할 수있는 primoPDF (무료)에 익숙합니다.

답변:


18

slhck의 답변과 scruss의 의견은 업데이트 될 가치가 있습니다 : pdfimages현재 (적어도 0.26.5 이후 버전) x-ppiy-ppi. 다음은 샘플 출력입니다.

$ pdfimages -list example.pdf 
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    2244  2244  cmyk    4   8  image  no       215  0   301   301  418K 2.1%
   2     1 image     900   600  rgb     3   8  image  no       324  0  1524  1525 35.5K 2.2%

데비안 (Wheezy)과 페도라 (23)에서 패키지의 pdfimages일부입니다 poppler-utils.


내 모든 비어
theonlygusti

8

이미지 데이터를 추출하지 않으려는 것이지만 이것이 원래 해상도를 찾는 유일한 방법 일 것입니다.


* nix에서 ImageMagick identifyXpdf가 설치된 경우 1 :

pdfimages -j test.pdf test && for file in $(find . -name "test*.jpg"); do identify "$file"; done

test.pdf입력 한 PDF는 어디에 있습니까 ? 출력 파일에 기록됩니다 test-000.jpg, test-001.jpg등등. 그러면 해당 PDF 2에 포함 된 모든 이미지의 원래 크기가 제공 됩니다.

하나의 큰 이미지 만 포함 된 PDF 파일의 예제 출력 :

./test-000.jpg JPEG 2500x1961 2500x1961+0+0 8-bit DirectClass 1.022MB 0.000u 0:00.000

1) Windows에도 이것들이 있지만 스크립트는 물론 다릅니다.
2) 이미지에는 실제로 DPI 정보가 포함되지 않습니다. 간단히 말해서 : 이것은 인쇄에 사용되는 것이며 이미지에는 고유 한 DPI 측정 값이 필요하지 않습니다.


텍스트 파일을 이미지 PDF로 변환하는 최적의 해상도는 무엇입니까? 96dpi, 300dpi 이상?

일반적으로 인쇄하려는 항목은 300dpi 이상이어야합니다. 대부분의 프린터는 더 높은 해상도를 처리합니다.


2
poppler 프로젝트의 pdfimage 버전 (원래 질문보다 최신 버전)에 -list 옵션이 추가되었습니다 pdfimages -list test.pdf. 파일을 출력하는 대신 크기와 이미지 유형이 나열됩니다. 여전히 명시 적으로 해상도를 제공하지는 않지만 출력 파일을 생성하지 않습니다.
scruss

1
버전 0.34.0의 @scruss로서 pdfimages -list명시 적으로 제공 x-ppi하고 y-ppi,뿐만 아니라 많은 다른 정보.
Skippy le Grand Gourou

실제로 이제는 @SkippyleGrandGourou : 질문이 나온 후 약 5 년이되었습니다. pdfimages는 여전히 추출하는 이미지에 해당 해상도 / 크기를 적용하지 않습니다.
scruss

@scruss 실제로,에 의해 제공되는 해상도 pdfimages는 상당히 떨어질 수 있습니다 (예 :에서 생성 된 PDF에서 이미지가 가시 영역보다 큰 경우 scribus). (안타깝게도 지금 버그 보고서를 제출할 시간이 없습니다.)
Skippy le Grand Gourou

4

어떤 이유로 CentOS에서 업그레이드 할 수있는 최신 버전의 pdfimage는 버전 3.04입니다.

따라서 이전 답변에서 언급 한대로 -list 옵션이 없습니다. 그러나 slhck의 답변을 기반으로 pdfimages로 만든 테스트 이미지에는 원하는 답변이 포함되어 있습니다!

-verbose test-0000.jpg를 식별하십시오 | 더

Image: test-0000.jpg  
Format: JPEG (Joint Photographic Experts Group JFIF format)  
Mime type: image/jpeg  
Class: DirectClass  
Geometry: 6600x5100+0+0  
Resolution: 600x600  
Print size: 11x8.5

따라서 dpi는 식별 명령에서 -verbose 옵션을 사용하여 6 번째 행에 명시 적으로 표시됩니다.

따라서 slhck의 답변은 다음과 같이 수정할 수 있습니다.

pdfimages -j test.pdf $ (파일 이름 찾기 & name "test * .jpg"); -verbose "$ file"을 식별하십시오 | awk 'NR == 6'; 끝난

다른 메모에서 나는 달리기를 시도했다.

-verbose test.pdf 식별

Format: PDF (Portable Document Format)  
Mime type: application/pdf  
Class: DirectClass  
Geometry: 792x612+0+0  
Resolution: 72x72  
Print size: 11x8.5  

Imagemagick은 항상 72dpi를 가정하므로 여기에 인쇄 된 정보가 올바르지 않은 것 같습니다.


1

PDF 파일은 고유 한 해상도를 갖지 않으며 그 안에있는 각 래스터 이미지 (있는 경우)는 자체 해상도를 갖습니다. 임베디드 이미지 XObject의 중간 / 모달 해상도를 위해 단일 숫자를 추출하는 간단한 방법을 모르겠습니다.


pdf에서 이미지 데이터를 추출하는 데 관심이 없지만 스캔 해상도가 무엇인지 알고 싶습니다. 매우 높으면 불필요하게 미래에 그것을 피하고 싶습니다.
hk_

@Dave : 실제로 이미지를 추출하지 않고 포함 된 이미지에 대한 정보를 추출하는 것을 의미했습니다. 그러나 slhck의 답변으로 문제를 해결할 수 있습니다.
RedGrittyBrick

1

이것은 Kyocera mfp에서 생성 된 pdf로 작동했습니다. 아마도 스캔과 같은 전체 페이지 이미지에만 유효합니다.

  1. pdf w / Reader-를여십시오
  2. 파일> 속성-설명 탭-페이지 크기. 내 예는 8.5x11.0 인치라고 말했습니다.

  3. 텍스트 편집기 (메모장)을 가진 PDF를 열고 찾아 /width/height

  4. 높이와 너비를 가져와 페이지 높이와 너비 (인치)로 나눕니다.

예:

5100/8.5=600
6600/11.0=600

내 PDF는 600x600 해상도로 스캔되었습니다.

문서 크기를 알고있는 경우 처음 2 단계를 건너 뛸 수 있습니다 (일반적으로 A4는 8.27x11.69입니다).


0

프린터 dpi에 대한 @slhck의 언급 외에도 300dpi는 글꼴 크기가 10 + pt 인 OCR에 권장되는 최소 권장 숫자입니다.

또한 최신 15 인치 4K 랩톱 화면에는 약 280PPi 만 있으므로 화면 (가로)에서 전체 A4를 보려면 ~ 320dpi보다 높은 포인트 스캔은 없습니다. 물론, 확대 할 계획이든 상관 없습니다. 더 높은 dpi가 필요할 수 있습니다.

다른 두 가지 요점에 답하기 위해 요즘에는 Acrobat Pro를 사용하여 이미지 DPI 및 해상도를 확인하고 편집 할 수도 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.