답변:
무료로 보았습니다. 그냥 시도해 보았습니다.
Google 문서 도구 는 이제 이미지 및 PDF에서 OCR (광학 문자 인식)을 사용하는 새로운 API 기능을 테스트하고 있습니다.
에서 구글 운영 체제 :
Google 문서 API는 이미지에서 OCR (광학 문자 인식)을 수행 할 수있는 새로운 기능을 테스트합니다. 있어 이 기능을 보여 라이브 데모 : 당신은 더 적은 10 MB의 JPG, GIF, 또는 PNG 이미지 고해상도를 업로드 할 수 있으며, 구글 문서 도구는 새 문서에 텍스트 및 변환을 추출합니다. 구글은 "현재 최대 40 초가 소요될 수있다"고 언급 한 바있다. 소규모 테스트 결과 서비스가 아직 신뢰할 수없는 것으로 나타났다.
결과는 완벽하지 않으며 많은 오류를 발견 할 수 있지만 서비스는 무료이며 지속적으로 개선되고 있습니다. 스캔 한 문서 의 OCR 결과는 다음과 같습니다 .
Google 문서 도구 문서는 HTML, OpenOffice 및 Word를 포함한 다양한 형식으로 내보낼 수 있습니다.
에 SO에 대한 내 대답은 당 쉽게 프로그래밍 DOCX 형식으로 PDF로 변환 할 수있는 방법의합니까 누군가의 노하우 :
SVG로 PDF를 변환하고 (ghostscript가 할 것입니다) 가져 오기 ...
요점은 Word가 PDF를 포함하지 않지만 SVG를 포함한다는 것입니다.
예를 들어 Omnipage Pro 와 같은 광학 문자 인식 프로그램을 사용하십시오 . PDF는 문서 입력으로, Word는 출력으로 지원합니다.
한 달에 20 페이지의 무료 서비스를 제공하는 OCRTerminal 을 사용해 볼 수도 있습니다 . 초대를 통해 사용할 수있는 베타 데스크탑 클라이언트가 있습니다 (문의하고 관심을 표명해야합니다).