"잘못된 XRef 항목"오류가 발생하여 PDF에서 텍스트를 추출 할 수 있습니까?

읽을 PDF가 있는데 Adobe Reader에서 열리지 않습니다. pdftotext를 사용할 때“Invalid XRef entry”라고 표시되는 것을 보았습니다. PDFtk와 Ghostscript는 파일을 구문 분석 할 수 없었습니다. 나는 그것을 수동으로 수리하려고 시도했지만 빨리 그것이 내 머리 위에 있다는 것을 깨달았습니다.

파일에서 텍스트를 복구하는 방법이 있는지 궁금합니다. 많은 이미지 리소스를 볼 수 있지만 텍스트가 명확하게 없습니다. 그것이 회복 될 수 있는지 아는 사람이 있습니까?

pdf

— KnightOfNi
소스

PDF 파일을 볼 수 있습니까?

— Edi

손상된 PDF를 처리하는 데있어 가장 관대 한 독자 중 하나는 Chrome 브라우저 기본 PDF 리더 인 IMO (pdfjs 기반)입니다. 시도해보고 파일을 렌더링하는지 확인할 수 있습니다

— Edi

@Edi "pdf 문서를로드하지 못했습니다."라는 메시지가 나타납니다. 그래도 좋은 생각이었습니다.

— KnightOfNi

PDF에서 수동으로 공회전하는 것은 실패합니다 (실제로 수행중인 작업과 수행 방법을 알지 않는 한).

Acrobat (Reader)의 현재 버전으로 문제를 해결할 수없는 경우 Acrobat / Reader 7 이상을 사용하려고 할 수 있습니다. 구 버전의 Acrobat / Reader 버전은 최신 문서보다 엉망인 문서를 복구하려고 더 많이 시도했습니다.

그렇지 않으면… 고칠 수있는 기회는 매우 적습니다.

— 맥스 와이즈
소스