PDF에서 임베드 된 이미지 추출


165

Ubuntu를 사용하기 전에 Nitro PDF 리더를 사용하여 PDF 파일에서 이미지를 자동으로 추출했습니다. 이 작업을 수행하는 Linux 용 PDF 리더가 있습니까?

스냅 샷을 찍을 때보 다 이미지를 더 빠르고 쉽게 추출 할 수 있기를 원합니다.


NitroPDF가 벡터 이미지로 얼마나 잘 수행되는지 기억할 수 있습니까? 수 pdfimagesNitroPDF 때보 다 / 더 나은 worser합니까?
Léo Léopold Hertz 준영


2
@ funky-future 분명히 두 질문은 중복되지만 중복 대상에는 두 개의 답변 만 있고이 두 답변 중 하나는 스팸 답변이므로 중복 질문은 듀피 해머에 의해 망치지 않도록 중복 방향을 바꿔야합니다.
karel

답변:


197

사용하다 pdfimages

pdfimages PDF 이미지의 이미지를 PPM, PBM, JPEG 또는 JPEG 2000 파일 형식으로 저장하는 PDF 이미지 추출기 도구입니다.

poppler-utils패키지 의 일부이므로 설치해야합니다.

용법: pdfimages [options] <PDF-file> <image-root>

예 : 다음은 PDF 파일에서 모든 이미지를 추출하여 JPEG 형식으로 저장합니다.

pdfimages -j in.pdf /tmp/out

PDF 파일의 이미지를 in.pdf파일 /tmp/out-000.jpg(또는 /tmp/out-000.pbm; 아래 참조) /tmp/out-001.jpg등으로 저장합니다.


pdfimages 매뉴얼 페이지 는 다음을 설명합니다.

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

8
기본 형식으로 이미지를 추출하는 솔루션이 있으면 좋을 것입니다. JPEG를 다시 인코딩하는 것은 실제로 이상적이지 않습니다.
Christian

32
사람 페이지에서 @Christian-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
wil93

2
-all스위치는 최근 poppler-utils 개정판에서만 지원됩니다. 예를 들어, 여전히 12.04 인 경우이 옵션에 액세스 할 수 없습니다
Glutanimate

1
사용할 수없는 경우 -allPNM 형식으로 이동하십시오. 손실이 없으며 PNG와 같은 이미지를 후 처리 할 수 ​​있습니다.
Tomasz Gandor

1
@Christian, $ pdfimages -list <PDF-file>"enc"열에서 원래 형식을 확인하는 데 사용하므로 이미지를 다른 형식으로 다시 인코딩 할 필요가 없습니다.
Jose Barakat

24

나는 종종 이것을 위해 Inkscape를 사용합니다. 페이지를로드하고 다른 모든 내용을 삭제하십시오. 이점은 SVG로 벡터 이미지를 가져 와서 원하는대로 수정할 수 있다는 것입니다.


일부 PDF는 Inkscape 내부 가져 오기로만 가져올 수 있습니다 (poppler / cairo 가져 오기 또는 pdfimage는 올바르게 구문 분석 할 수 없음). 일단 수입, 복사 및 붙여 넣기 이미지를 새 파일 및 선택에 페이지 크기를 조정 graphicdesign.stackexchange.com/a/21638/95041
sdaffa23fdsf

나에게 아무런 문제가 없습니다. 그것이 최상의 해결책이었습니다. 한 번에 한 페이지를 선택해야합니다!
지미 올라 노

5

원본 이미지가 EPS로 제공되는 LaTeX로 만든 이미지가 포함 된 이중 열 PDF 파일이 있습니다. 에 따라 제안 된 솔루션을 시도 pdfimages했지만 불행히도 이미지를 반환하지 않았습니다. 그런 다음 Inkscape를 사용하려고 시도했지만 생성 된 SVG 이미지가 왜곡되어 EPS로 내보내는 운이 없었습니다.

우리를 위해 일한 소프트웨어는 MasterPdfEditor였습니다 .

절차는 다음과 같습니다

  • Master PDF Editor를 사용하여 파일 열기
  • 사용 편집 도구를 사용하면 추출 할 이미지를 선택 (Alt + 1)
  • 그림 복사 (Ctrl + C)
  • 이미지 주변의 대시 파선을 클릭하고 오른쪽 사이드 바 (Object Inspector)를 확인하고 "Geomerty"를 클릭하십시오. 거기에서 당신은 당신의 선택의 크기를 볼 수 있습니다
  • 새 파일을 만듭니다 (Ctrl + N). 페이지 크기를 제공하라는 메시지가 표시됩니다. 이미지의 정확한 크기를 제공하고 새 파일을 만드십시오
  • 이제 조금 까다 롭습니다. 이미지를 붙여 넣으십시오 (Ctrl + V). 이미지가 새 파일에 표시되지 않을 수 있습니다. 추적 할 수있을 때까지 화살표를 사용하여 이동하십시오.
  • 화살표를 사용하여 새 페이지의 이미지를 중앙에 배치하십시오
  • PDF로 저장

결과는 매우 높은 품질이지만 소프트웨어는 무료가 아닙니다. "모든 기능을 시도해 볼 수있는 데모 버전이 있지만"출력 파일에 워터 마크 추가 "가 제공됩니다. 솔직히 말해서, 나는 제작 된 PDF에서 워터 마크를 보지 못했습니다.


이것은 우분투에게 묻습니다 ... 우리는 여기서 오픈 소스를 좋아하고 귀하의 솔루션은 비공개 소스 상용 솔루션입니다 ... 어떻게 이미 상향식 대답보다 나은가? (당분간 -1)
Fabby

3
@Fabby 피드백에 감사드립니다. 나는 그것에 대해 몰랐다. askubuntu.com에 이러한 규칙이 있습니까? 그러나 Ubuntu 소프트웨어 센터 를 열 자마자 무료 응용 프로그램에 대한 제안을받습니다.
Pantelis Sopasakis

아니요, "규칙"이 없기 때문에이 답변을 삭제하기 위해 투표하지 않았지만 무료 맥주 무료 연설에서 같이 더 나은 도구가 있으므로 의견 일뿐입니다.
Fabby

1
+1. ImageMagick 명령 줄을 사용했지만 GUI를 찾는 사람에게는 흥미로운 솔루션입니다.
rpmcruz

2
그것은 일부 사람들에게 효과적입니다. 나치가되지 마라.… "우리"가 누군지 모른다. 당신은 자신을 위해 말할 수 있습니다. 답변 +1
sdaffa23fdsf

4

pdfmod를 사용해 볼 수도 있습니다. 이미지를 추출하고 다른 기본 pdf 조작을 수행 할 수있는 GUI (그래픽 인터페이스)입니다.


흠, 나에게 약간의 버그가있는 것 같습니다. 주로 보라색 이미지가있는 PDF를 삽입하고 녹색 이미지를 얻습니다.
DBX12

2

pdf / eps 형식으로 자른 이미지가 필요한 경우 pdfmod(To Do에서 제안한대로)를 사용하여 이미지가있는 페이지를 추출하십시오 .

그런 다음 사용 pdfcrop하면 시행 착오를 통해 여백을 올바르게 설정 하여 자를 수 있습니다.

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

1

커맨드 라인 도구 인 pdfimages를 사용하며 나에게 효과적입니다. 사용하기가 매우 쉽고 --help 옵션을 사용하여 사용법에 대해 자세히 알아볼 수 있습니다. 나는 Ubuntu를 사용하며 사전 설치되어 제공됩니다. pdf 파일이 암호화되어 있거나 비밀번호로 보호되어있는 경우 해당 옵션이 있으므로이 도구가 효과적입니다. 당신이 읽을 수있는 pdfimages 약을 여기에


4
답변을 게시하기 전에 다른 답변을 읽으십시오. 이것을 다루는 다른 것이 있습니다.
edwin

좋아, 미안 :) 암호로 보호 된 pdf 파일에 대한 정보가 있기 때문에 내 게시물을 게시하려고 생각 했는데이 도구 에이 옵션이 있음을 설명 하고이 도구에 대한 자습서 인 링크를 게시했습니다.
jetbird13

평판이 충분하면 다른 사람의 답변에 대해 의견을 말하거나 반대 의견을 제시 할 수 있습니다.
edwin

1

pdfimage를 사용하면 추출 된 이미지가 둘 이상의 부분에있을 수 있습니다. 추출 된 형식에 대해 걱정할 필요없이 간단한 방법으로 부품을 LibreOffice Draw로 가져 와서 이미지 자르기 대화 상자로 자르고, 부품을 배치하고, 페이지 크기를 조정하고 원하는 형식으로 내보내는 것입니다.


1

pdfviewer를 사용하여 pdf에서 이미지를 자르려면 okular를 사용해보십시오. png 또는 jpeg 형식으로 모든 내용 (텍스트 또는 이미지)을자를 수 있습니다. pdf에서 png 형식의 이미지를 추출하려면 pdftohtml을 사용하여 최소한의 명령으로 이미지를 추출 할 수 있습니다. pdf를 html plus 이미지로 변환합니다. https://www.youtube.com/watch?v=CG1rf7k3xo8과 같은 예를 찾을 수 있습니다 . pdf에서 많은 이미지를 추출하려면 시도해보십시오.


0

사용 된 소프트웨어 : Xreader OS : Antergos

단계 :

  1. PDF 열기
  2. 이미지를 마우스 오른쪽 버튼으로 클릭
  3. 다른 이름으로 이미지 저장을 선택하십시오.
  4. 파일 이름과 확장자를 입력하십시오.
  5. 저장하기.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.