«text-extraction» 태그된 질문

13
PDF를 텍스트로 변환하는 Python 모듈 [닫기]
닫은. 이 질문은 스택 오버플로 지침을 충족하지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 질문 업데이트 는 그래서 주제에 스택 오버플로합니다. 휴일 오년 전에 . PDF 파일을 텍스트로 변환하는 파이썬 모듈이 있습니까? pypdf를 사용하는 Activestate에서 발견 된 한 가지 코드를 시도했지만 생성 된 텍스트 사이에 공백이없고 사용되지 않았습니다.


15
PDF에서 텍스트를 추출하는 방법? [닫은]
닫은. 이 질문은 스택 오버플로 지침을 충족하지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 질문을 업데이트하여 스택 오버플로에 대한 주제 입니다. 휴일 오년 전에 . 이 질문을 개선하십시오 PDF에서 텍스트와 이미지를 추출하기 위해 라이브러리 / API를 추천 할 수 있습니까? 문서의 미리 알려진 영역에 포함 된 텍스트를 얻을 …

8
grep, regex 또는 perl을 사용하여 패턴에 따라 문자열을 추출하는 방법
다음과 같은 파일이 있습니다. <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> 나는 따라 따옴표 안에 아무것도 추출해야 name=즉,, content_analyzer, content_analyzer2와 content_analyzer_items. Linux 상자에서이 작업을 수행하고 있으므로 sed, perl, grep 또는 bash를 사용하는 솔루션이 좋습니다.

5
Python에서 PDFMiner를 사용하여 PDF 파일에서 텍스트 추출?
Python과 함께 PDFMiner를 사용하여 PDF 파일에서 텍스트를 추출하는 방법에 대한 문서 또는 예제를 찾고 있습니다. PDFMiner가 API를 업데이트하고 내가 찾은 모든 관련 예제에 오래된 코드가 포함되어있는 것 같습니다 (클래스와 메서드가 변경됨). PDF 파일에서 텍스트를 더 쉽게 추출하는 작업을 수행하는 라이브러리는 이전 PDFMiner 구문을 사용하고 있으므로이 작업을 수행하는 방법을 잘 모르겠습니다. …

2
Python을 사용한 PDF 구문 분석-형식화 된 일반 텍스트 추출 [닫힌]
닫은. 이 질문은 Stack Overflow 지침을 충족하지 않습니다 . 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? Stack Overflow의 주제에 맞게 질문을 업데이트하세요 . 휴일 오년 전에 . 이 질문 개선 PDF 문서에서 텍스트를 추출 할 수있는 PDF 라이브러리를 찾고 있습니다. 필자는 PyPDF를 살펴 봤는데 이것은 PDF 문서에서 텍스트를 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.