여러 가지 종류의 법적 청구 인보이스가 있습니다. Excel 시트로 디지털화하고 싶습니다. 그들의 레이아웃이 다르기 때문에 많은 것들이 있기 때문에, 나는 그들을 다루는 방법을 찾을 수 없습니다. 누군가 내게 실용적인 해결책을 제공 할 수 있습니까?
여러 가지 종류의 법적 청구 인보이스가 있습니다. Excel 시트로 디지털화하고 싶습니다. 그들의 레이아웃이 다르기 때문에 많은 것들이 있기 때문에, 나는 그들을 다루는 방법을 찾을 수 없습니다. 누군가 내게 실용적인 해결책을 제공 할 수 있습니까?
답변:
내가 아는 좋은, 합리적인 가격의 해결책은 없다. (
Nuance OmniPage 나 Abby FlexiCapture를 시험해 볼 수 있습니다 (데스크톱 에디션이 $ 100k 엔터프라이즈 버전까지 있습니다). 얼마 전 나는 그들 사이에 SDKs / OCR 품질을 비교했다. 별다른 차이는 없지만 Abbyy가 조금 더 좋았다고 느꼈지만 (Nuance는 몇 차례 추락했습니다. Abbyy는 그렇지 않았습니다).
OmniPage와 FlexiCapture (FineReader) 모두 PDF 파일을 편집 가능한 Excel 파일로 변환하는 데 사용되는 데스크톱 버전이 있습니다. 무료 평가판을 사용하여 배웠던 것에서는 편집 가능한 Excel 파일을 만들지 만 매우 고품질의 깨끗한 소스 만 사용할 수있었습니다. 두 제품 모두 일괄 처리 기능을 제공합니다.
또한 나는 scanstore.com을 놀라운 자원으로 생각했습니다 :
http://www.scanstore.com/Scanning_Software/Forms_Processing/Invoice_Processing/
오픈 소스를 찾고 있다면 최고의 '엔진'은 tesseract입니다. 당신은 그것을 둘러싼 전체 폼 캡쳐 비트를 만들어야 할 것입니다. 이 문제를 해결하기 위해 몇 가지 방법을 생각해 보았습니다.
아, 그리고 FYI에는 데이터 입력 작업을 수행 할 실제 사람들이있는 'BPO'서비스 회사가 많이 있습니다. 생각만큼 비싼 것이 아닙니다.
다음은 무료 OCR 소프트웨어입니다 : CuneiForm, GOCR, Ocrad, OCRopus, Tesseract. 그러나 그 결과는 그렇게 좋지 않습니다. 그러나 FineReader, ExperVision, OmniPage를 사용해 볼 수 있습니다. 결과가 더 좋을 것입니다. 그러나 내 경험에 비추어 볼 때 순수한 기술 솔루션에 의존 할 수는 없습니다. 합리적인 가격으로 프로젝트 비용을 관리하고 싶다면. OCR 기술과 인적 자원의 통합은 좋은 선택입니다. 내가 아는 한, Expervision은 맞춤형 OCR 기술과 BPO 서비스를 모두 제공 할 수 있으며 웹을 확인할 수 있습니다. Expervision