pdf 파일에서 텍스트를 복사 할 수 없습니다


39

교과서를 보려면 foxit PDF 리더를 사용하고 있습니다. pdf 파일의 텍스트를 단어 문서로 복사하고 싶지만 나에게 도움이되지 않습니다. 텍스트를 잘 선택할 수 있지만 텍스트 복사 옵션을 사용할 수 없습니다. 다른 문서의 텍스트는 복사 할 수 있지만 일부는 복사 할 수 없습니다. 창문 에서이 보호를 피할 수있는 방법이 있습니까?


내 답변이 효과가없는 것 같습니다. 현상금을 게시했습니다. 그러한 PDF의 예를 어딘가에 게시하면 살펴볼 것입니다.
harrymc


@endolith : 내 새로운 답변을 참조하십시오.
harrymc

답변:


29

pdf 파일이 텍스트 복사에 대해 잠겨있을 수 있습니다. 다음은 잠금을 해제하는 두 가지 방법입니다.

  1. PDF가 인쇄에 대해 잠겨 있지 않은 경우 가상 PDF 프린터로 인쇄하여 잠금 해제 파일을 만들 수 있습니다.
    "비밀을 모르고 인쇄 할 수있는 암호 제거 및 보호 된 PDF 잠금 해제"를 참조하십시오 .
  2. 인쇄 기능이 잠긴 경우
    "PDF Unlocker를 사용하여 제한 사항 제거 및 비밀번호로 보호 된 PDF 파일 암호 해독"을 참조하십시오 .

PDF가 복사 용으로 잠겨 있는지 확인할 수 있습니다. File (파일) 메뉴에서 Properties (속성)를 선택하면 Security (보안) 탭에 Content Copying (콘텐츠 복사)가 허용되는지 여부가 표시됩니다.
Rob Sedgwick

PDF 인쇄를 시도했습니다. 인쇄 된 파일은 텍스트를 선택할 수 없으며 텍스트를 이미지로 변환 한 것 같습니다.
퀴즈

@queezz : PDF에는 시작할 이미지가 포함되어 있어야합니다.
harrymc

@ harrymc 네, 이미지가 있습니다. 그러나 텍스트도 이미지로 변환됩니다. Chrome 옵션은 동일한 문서에서 잘 작동합니다.
퀴즈

첫 번째 링크 는 primopdf.com/installers/4.0.1/FreewarePrimo64Setup.exe에 링크되어 작동하지 않으며 archive.org에도 아카이브하지 않은 것처럼 보입니다. 두 번째 링크는 정상이지만 파일 공유 사이트 dfiles.eu/files/7kiqyvswk에 링크되지만 파일은 괜찮지 만 virustotal로 검사됩니다. 그러나 mydigitallife 페이지에 다양한 링크가 있으므로 찾기가 쉽지 않습니다. "PDF Unlocker는 무료이지만 사용자에게 친숙한 도구이며 여기 링크 (현재 버전 1.0.4)를 통해 다운로드 할 수 있습니다."
barlop

25
  1. Google Chrome에서 PDF를 엽니 다 (PDF 파일을 Chrome으로 끌어다 놓기).
  2. 특정 페이지를 PDF로 인쇄하거나 인쇄 미리보기를 엽니 다.
  3. 이제 인쇄 미리보기 또는 출력 PDF에서 텍스트를 복사 할 수 있습니다. 그러나 나는 당신이 직접 테이블을 복사 할 수 있다고 생각하지 않습니다.


4
이것은 나에게도 효과적입니다. 이것이 내가 보는 가장 쉬운 방법입니다.
endolith

3
절대적으로 훌륭합니다. 어쨌든 파일을 Chrome의 탭 표시 줄로 드래그하여 빠르게 열 수 있습니다.
iono 2019

이러한 방법 중 어느 것도 Chrome 53에서 저에게 효과적이지 않았습니다. 허점이 막혔을 가능성이 있습니까?
Simon East

11

Ghostscript (Windows에서 사용 가능)를 사용하여 DRM이없는 PDF 파일 버전을 만들 수있었습니다 .

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

결과 파일 stripped.pdf을 Adobe Reader에로드 할 수 있으며 Reader를 사용하면 원하는 부분을 복사 할 수 있습니다. 또한 대부분의 표 서식을 유지합니다.


훌륭합니다. 세금 회계사가 DRM 이외의 PDF 또는 DRM을 제거하기위한 암호를 제공하지 않습니다. 이것은 내 문제를 해결합니다. 잘했습니다!
kevinarpe

PDF에 암호가 있으면 -sPDFPassword스위치 ( -sPDFPassword=password) 를 포함 시키십시오 .
palswim

2

Okular (Linux의 경우 KDE의 일부)를 사용하여 PDF 파일에서 테이블을 성공적으로 복사 할 수있었습니다. 이렇게하려면 Okular 설정으로 이동하여 "DRM 제한 준수"를 선택 해제해야했습니다.

Windows를 실행하고 있기 때문에 이것이 실제로 도움이되지는 않지만 Linux 시스템이 편리하거나 설치하려는 경우 가능성이 있습니다.

불행히도 형식이없는 일반 텍스트이지만 테이블을 다시 작성하기가 너무 어렵지 않은 것처럼 보입니다. 내 복사 및 붙여 넣기 모험의 결과를 여기에서 볼 수 있습니다 .


이것이 바로 VirtualBox를위한 것입니다. : DI는 서식을 지정하지 않고 일반 텍스트를 복사 할 수도 있지만 한 번에 하나의 열을 선택하면 쉽게 내보낼 수 있습니다.
endolith

Okular를 사용하면 텍스트를 사각형으로 선택하고 단일 열을 순서대로 추출 할 수 있으므로 숫자 테이블에 가장 적합합니다.
endolith

단일 열의 경우 아마도 그렇습니다. 전체 표는 다른 답변을 참조하십시오 .
Michael Hampton

Okular Windows에서 실행할 수 있습니다 . 실제로 많은 KDE 소프트웨어가 Windows에서 실행될 수 있습니다 .
Bakuriu

1

GT Text는 이미지 (pdf 스냅 샷 = 이미지)를 텍스트로 변환하는 프로그램입니다. 당신은 지역을 선택하고 클립 보드에 복사 할 수 있습니다 그것은 무료입니다

공식 홈페이지는 http://gttext.googlecode.com입니다.


1

복사가 회색으로 표시되면 현재 의심 스럽기 때문에 PDF가 '잠겨 있습니다'. 읽을 수는 있지만 실제로 복사 / 붙여 넣기를 막을 수 있습니다.

이 웹 사이트는 PDF를 잠금 해제합니다

https://smallpdf.com/unlock-pdf


0

짧은 스 니펫을 찾으려면 Google에 따옴표 안에 몇 단어를 입력하고 이미 다른 형식으로 스캔되었거나 다른 사람이 입력 한 정확한 견적을 찾을 수 있습니다.

다른 옵션은 Google 문서 도구 Android 앱의 "문서에서 사진"으로, OCR을 통해 텍스트를 표시합니다. 물론 오류가 발생하기 쉽습니다.

PDF 잠금 기능이 존재하지 않기를 바랍니다. :(


0

endolith에 대한 답변 :

PDF는 복사되지 않지만 인쇄되지는 않습니다.

그래서 표 6.15가 포함 된 한 페이지를 복사 방지되지 않은 다른 PDF로 인쇄하고 표를 선택하여 복사 한 다음 Word에 붙여 넣었습니다. 놀랍게도 페이스트의 결과는 완전히 쓰레기였습니다.

나는이 표를 더 자세히 살펴 보았고 매우 놀라운 결과를 발견했다. 이것은 표가 아니다!

실제로는 테이블처럼 보이도록 페이지에 배치 된 작은 텍스트 조각의 몽타주입니다. 그러나 이것은 실제 테이블이 아닙니다.

당신이 할 수있는 최선의 방법은 전체를 테이블로 다시 작성하거나 작업 에서이 테이블과 같은 조립 된 텍스트의 스크린 샷을 사용하는 것입니다.

생성 된 한 페이지 pdf 문서 에서 가져온 표의 스크린 샷은 다음과 같습니다 .

영상


나는 2 개의 프로그램으로 인쇄하려고했지만 빈 페이지 만 있으면됩니다.
endolith

Foxit Reader를 사용 하여 페이지에 자신을 배치 한 다음 현재 페이지를 pdf 프린터로 인쇄했습니다 ( Cute Pdf Writer 사용 ). 오늘 저녁 테이블 복사 문제를 분석하려고합니다.
harrymc

PrimoPDF와 qvPDF (GhostScript를 사용하는)를 사용해 보았습니다
endolith

위의 추가 내용을 참조하십시오.
harrymc

... 또한 한 페이지 pdf 를 여기에 업로드 했습니다 (대기 시간 60 초).
harrymc

0

또 다른 가능성은 Evince 입니다.

Windows에서는 기본적으로 복사를 지원하는 것 같습니다.

Linux에서는 override_restrictions다음 지침에 따라 설정 을 확인하여 ( dconf-editor/org/gnome/evinceoverride_restrictions) 복사를 활성화 할 수 있습니다 .


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.