pdf을 odt 파일로 변환하는 방법?


32

.pdf파일을 파일 로 변환하여 파일로 .odt더 변환 할 수 .doc있습니다. 이를 수행 할 수있는 소프트웨어 / 스크립트가 있습니까? .pdf파일 의 내용을 복사 하여 형식이 유지되지 않는 liberoffice 작가에 붙여 넣었습니다.

이 문서는 기밀이므로 변환에 온라인 서비스를 사용하지 않는 것이 좋습니다.

도움을 주시면 감사하겠습니다.


관련 (그러나 중복은 아님 ) : odt를 pdf로 변환하는 방법?
Eliah Kagan

1
LIBREOFFICE / OpenOffice 관련 질문은 ask.libreoffice.org
Bucic

답변:


15

무료 PDF to ODT 변환기가 부족하여 짜증이났습니다. 복잡한 것도 필요하지 않았습니다. LibreOffice에서 주석을 달 수있는 ODT 파일을 생성하는 도구 (예 : 양식 작성)

PDF 문서를 그래픽 파일로 변환 한 다음 LibreOffice로 가져 와서 수동 으로이 작업을 수행하는 방법을 알고 있지만 지루합니다.

그래서 마침내 필요한 모든 단계를 자동으로 수행하는 작은 쉘 스크립트를 작성했습니다. https://github.com/gutschke/pdf2odt 에서 찾을 수 있습니다.

많은 PDF 및 이미지 파일을 입력으로 가져 와서 LibreOffice에서 열고 편집 할 수있는 ODT 파일을 생성 할 수 있습니다. 이미지는 페이지 배경으로 표시되므로 자유롭게 덮어 쓸 수 있습니다. 각 이미지는 자체 페이지 스타일과 연결됩니다. 페이지 나누기를 삽입 할 때 필요에 따라 페이지 스타일을 조정하십시오.

Linux와 Mac에서 스크립트를 테스트했습니다. 합리적으로 표준 도구 몇 개만 있으면되므로 휴대가 간편해야합니다.


이 스크립트는 각 페이지의 스크린 샷을 만들어 대상 형식으로 플로팅합니다. Gutschke
Oliver

pdf2oo몇 년 전에 사용 했지만 이제는 LibreOffice의 손상된 파일을 생성하는 것 같습니다. 이 스크립트는 그 이상을 수행합니다-감사합니다!
eacousineau

3
불행히도 pdf2odt 스크립트는 ODT 배경으로 사용되는 이미지 형식으로 변환합니다. 원본 텍스트를 "편집"할 수있을 것으로 기대하지 마십시오.
Richard Elkins

13

pdftotextPDF Utilities 를 포함하는 (Synaptic 또는 apt-get을 통한 poppler-utils)를 볼 수 있습니다 :

Poppler는 Xpdf PDF 뷰어를 기반으로하는 PDF 렌더링 라이브러리입니다.

이 패키지에는 PDF 문서의 정보를 얻거나 다른 형식으로 변환하거나 조작 할 수있는 명령 줄 유틸리티 (Poppler 기반)가 포함되어 있습니다.
* pdfdetach-포함 된 파일 (첨부 파일)을 나열하거나 추출 합니다. * pdffonts-
글꼴 분석기
* pdfimages- 이미지 추출기
* pdfinfo-문서 정보
* pdfseparate-페이지 추출 도구
* pdftocairo-Cairo를 사용하여 PDF로 PNG / JPEG / PDF / PS / EPS / SVG 변환기
* pdftohtml-PDF에서 HTML 변환기
* pdftoppm-PDF에서 PPM으로 / PNG / JPEG 이미지 변환기
* pdftops-PDF to PS (PostScript) 변환기
* pdftotext-텍스트 추출
* pdfunite-문서 병합 도구

물론 성공 여부는 pdf 파일 생성 방법에 따라 다릅니다. 텍스트 파일로 당신이 원하는 것을 얻을 경우, 당신은 할 수 후 저장 .ODT 파일로 저장됩니다.

편집 : 견적의 출처를 제공하는 것을 잊었습니다. 시냅틱의 설명 탭에서PDF Utilities (based on Poppler).


3
pdftohtmlHTML은 형식을 지정할 수 있으므로이 목록 에서 작업에 가장 적합해야합니다. 그런 다음 HTML을 ODT 또는 DOC로 변환 할 수 있습니다.
imz-Ivan Zakharyaschev

10

LibreOffice는 .pdf파일 을 가져올 수 있습니다. 최상의 결과를 얻으려면 현재 버전의 LibreOffice에서 열기 만하면됩니다. 그러나 문서를 도면으로 열면 Writer 문서가 아니라 지원되는 이미지 형식 중 하나로 만 변환 할 수 있습니다.

당연히 모든 서식이 유지되는 것은 아니지만 최소한 일부는 유지됩니다.


1
최근에 시도했지만 끔찍합니다. 서식을 조금도 저장하지 않습니다. 또한 텍스트를 읽을 수 없게 만듭니다.
Hi-Angel

3

는 IF poppler-utils를의 패키지가 설치되면, 노틸러스 스크립트 아래는 "-i"은 다음을 포함 삭제할 수 있습니다 옵션 (HTML로 변환 PDF 파일을 도움이 될 것입니다 (폴더 실행 파일로 ~ / .gnome2 / 노틸러스 - 스크립트에 배치되는) 형식 변환의 성공 여부는 PDF 작성 방법에 따라 크게 다르지만 LibreOffice Writer에서 열고 ODT로 저장할 수 있습니다 .

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


이 유용한 스크립트에 감사드립니다. 작은 말만 (에서 man pdftohtml) : -noframes : generate no frames. Not supported in complex output mode.그래서 설정에 -noframes아무런 영향을 미치지 않습니다 -c.
Glutanimate

2
감사합니다. 스크립트에서이 중복 옵션을 제거했습니다. 이러한 모든 옵션에 대한 GUI를 제공하는 zenity-powered bash 스크립트는 매우 좋을 것 같습니다 ;-)
Sadi

#MHC,이 정보가 잘못된 것 같습니다. -noframes를 포함하지 않으면 pdf 페이지를위한 별도의 html 파일이 제공됩니다. 스크립트에 다시 삽입했습니다.
Sadi

이상하다. 그때 문서에서 실수해야합니다. 그에 따라 스크립트 사본을 변경하겠습니다. 고마워요!
Glutanimate

3

Calibre를 사용해보십시오. html로 변환 한 다음 다른 형식으로 변환합니다. 다른 방법으로 인쇄해야 할 큰 (183 페이지) 파일에서 꽤 잘 작동했습니다.

제 경우에는 epub으로 변환했지만 재미를 위해 .docx로 변환하여 매우 잘 나타났습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.