텍스트를 PDF로 변환하는 PDF [닫기]


9

모든 PDF를 가져 와서 일반 텍스트로 변환하는 "원 클릭"방식을 찾고 있습니다. OSX 또는 Linux에 이상적입니다.

이상적으로 솔루션에는 OCR 기능이 포함되지만 반드시 그럴 필요는 없습니다.

최우선 순위는 구성없이 모든 파일을 취할 수있는 것입니다.

답변:


23

있다 xpdf를 포함 pdftotext바이너리.

Pdftotext는 PDF (Portable Document Format) 파일을 일반 텍스트로 변환합니다.

Linux에는 사용 가능한 설치 프로그램이 있습니다. poppler-utils패키지 에도 들어있는 것 같습니다 . OS X에서는 Homebrew (먼저 설치)를 사용하여 설치 한 다음

brew install homebrew/x11/xpdf

소스 파일을 다운로드하여 OS X 용으로 컴파일합니다. 그 후 다음과 같이 사용하십시오.

pdftotext your_pdf_file.pdf

일반 텍스트 파일이 생성됩니다. 몇 가지 옵션도 있습니다 man pdftotext. 자세한 내용을 확인 하십시오.

대안은 OSX에서 poppler입니다 .

brew install poppler

데비안과 친구들

apt-get install poppler-utils

오늘 명령은 다음과 같습니다brew install homebrew/x11/xpdf
Diego Vieira

1
@DiegoVieira 감사합니다. 다음에는 편집을 제안하십시오!
slhck 2016 년

xpdf / pdftotext 대신 poppler를 사용하면 어떤 이점이 있습니까?
Gonzalo Bahamondez 2016 년

brew install Caskroom/cask/pdftotext
휴고

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.