내 문제는 640 페이지 PDF 파일에서 이미지를 추출하는 것입니다.
대부분은 텍스트가있는 차트와 테이블입니다. 간단한 복사 및 붙여 넣기를 수행하면 이미지의 해상도가 떨어지고 텍스트가 흐려지고 때로는 읽을 수 없게됩니다.
해상도에 영향을주지 않고 PDF 파일에서 이미지를 추출하는 더 좋은 방법을 알고 있습니까?
내 문제는 640 페이지 PDF 파일에서 이미지를 추출하는 것입니다.
대부분은 텍스트가있는 차트와 테이블입니다. 간단한 복사 및 붙여 넣기를 수행하면 이미지의 해상도가 떨어지고 텍스트가 흐려지고 때로는 읽을 수 없게됩니다.
해상도에 영향을주지 않고 PDF 파일에서 이미지를 추출하는 더 좋은 방법을 알고 있습니까?
답변:
XPDF 제품군 (무료 및 오픈 소스 소프트웨어)에서pdfimages.exe
CLI 도구를사용하여 PDF에서 모든 이미지를 추출하거나 다양한 페이지에서 모든 이미지를 추출할 수 있습니다. 다음은 33-36 페이지에서 모든 이미지를 추출하는 예입니다.
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
는 -j
JPEG 파일로 포함 된 JPEG 이미지를 추출하려고합니다. 다른 모든 이미지는 PPM (Portable pixmap)으로 출력됩니다. 주의, PPM은 완전히 압축되지 않았습니다!
./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
evince
우분투에서 (문서 뷰어)를 사용하면 매우 쉽습니다 . 를 사용하여 pdf를 연 evince
다음 창을 최대화 해제하고 표시 Always on top
한 다음 원하는 폴더로 이미지를 끌어다 놓습니다 .
원본 해상도 이미지 추출은 Solid Framework SDK의 무료 기능 중 하나이므로 C #에서 솔루션을 만드는 경우 다음과 같습니다. http://www.soliddocuments.com/features.htm?product=SolidFramework
GUI 배치 솔루션이 필요한 경우이 기능을 보여주는 샘플 응용 프로그램도 무료입니다. http://www.pdf-internals.com/download.htm?product=SolidPDFMechanic
(나는 단단한 문서를 가지고있다)
(1) Word 2013 에서 파일을 열 수 있습니다 (파일-열기 만 사용). 이미지를 복사 할 수 있습니다. 해상도는 인쇄하기에 충분하지만 원본과 같은지 확실하지 않습니다.
(2) 프리웨어 뷰어 SumatraPDF (LaTeX를 사용하는 경우 매우 좋음)는 이미지를 마우스 오른쪽 버튼으로 클릭하면 "이미지 복사"메뉴 옵션이 있습니다. 해상도를 유지한다고 생각합니다 (이미지를 복사 할 수없는 파일을 보았지만).
(3) 파일 아래의 Adobe Acrobat X 에는 다른 이미지로 저장이 있으며 기본적으로 고해상도를 사용합니다 (원시 해상도 인 경우).
(4) Perl 에는 여러 가지 방법이 있습니다. 예를 들어 여기 에서 읽고 특히 JPEG 이미지를 추출하는 프로그램이 언급되어 있습니다.
아니오-복사 및 붙여 넣기는 포함 된 리소스의 원래 해상도를 유지해야합니다. PDF 내부에서 축소 된 저해상도 그림이므로 내보낼 때보 다보기에 좋지 않습니다.
축소하거나 PDF에서와 동일한 크기로 만들어보십시오. 실제로는 같아야합니다.
또는 (및 최악의 옵션) 100 % 확대 / 축소로 이동하여 스크린 샷을 찍거나 Windows Vista / Windows 7에서 스나이핑 도구를 사용하십시오.
참고-의 이미지 .PDF
는 일반적으로 이미지 가로 변환 될 때 축소 / 압축 .PDF
되지만 압축 된 후에는와 동일한 품질로 추출 할 수 있어야합니다 PDF
.
어떤 PDF보기 소프트웨어를 사용하고 있습니까?
Adobe Acrobat Pro 와 같은 PDF 편집 / 작성 프로그램 을 사용하면 포함 된 이미지를 PDF 파일에있는 그대로 추출 할 수 있습니다 *. Adobe 사이트 (Windows 및 Mac 용)에서 무료 평가판을받을 수 있으며 목적에 따라 사용할 수 있습니다.
* 그들이 보호되지 않는 한, 당신은해야 할 것입니다.
Imagemagick 을 사용 하여 모든 PDF 페이지를 별도의 이미지 파일로 변환 할 수 있지만 (그러한 큰 문서를 작성하는 데 얼마나 오래 걸리거나 잘 대처할 수 있을지는 확실하지 않습니다!) 원하는 것을 잘라낼 수 있습니다. 적어도 포함 된 이미지의 해상도가 필요한 것에 맞는지 알기 때문에 시범 운영을해볼 가치가 있습니다.
Acrobat pro를 사용하는 경우 고해상도 스냅 샷을 만드는 가장 간단한 방법입니다 (원하는 높이 설정). 환경 설정 / 일반에서 ' 스냅 샷 도구에 고정 해상도 사용 '이라는 확인란을 선택하고 원하는 해상도로 300ppi 이상으로 설정하십시오. 그런 다음 스냅 샷 (도구 / 선택 및 확대 / 축소 도구)을 찍으면 고해상도 사본이 클립 보드에 복사됩니다. 그런 다음 클립 보드에서 원하는 곳에 붙여 넣습니다. 잘 작동합니다.
더 자세한 설명을 보려면이 링크를 클릭하십시오 ...
어도비 아크로뱃 프로
파일> SaveAs는 "편집> 기본 설정"의 PDF에서 변환 을 사용합니다.
[PDF에서 변환]은 각 파일 형식에 대해 [설정 편집 ...]을 허용합니다
최고는 PDF를 만드는 데 사용 된 소스 이미지와 해상도에 따라 다릅니다.
그러나 손실없는 TIFF 설정을 편집하면 꽤 좋은 결과를 얻을 수 있습니다
해상도를 1200 이상으로 설정하고 (저장 실패가 낮게 설정 한 경우) 원본 파일> 다른 이름으로 저장을 사용하여 PDF 파일을 고해상도 개별 파일로 렌더링하십시오.
가장 좋은 방법은 아니지만 다른 문서 유형으로 렌더링하는 것보다 훨씬 낫습니다.
파일은 매우 크지 만 잘라 내기 및 붙여 넣기에 더 적합합니다.
Adobe InDesign에서 '장소'명령을 사용하여 PDF 파일을 가져올 수 있습니다. 특정 페이지를 가져 오려면 배치 명령을 클릭 한 후 나타나는 대화 상자에서 가져 오기 옵션 표시 확인란을 활성화하십시오. 고해상도 이미지로 필요한 것이 페이지에 맞도록 프레임을 끌어서 크기를 조정하십시오. 이미지의 종횡비에 따라 문서 페이지 크기를 조정해야하는 경우가 많습니다. 표시된 내용에 만족하면 내보내기 명령을 사용하여 고품질 PDF를 선택하십시오. 이렇게하면 라텍스 문서에서 인쇄하거나 사용할 수있는 고해상도 PDF가 만들어집니다.