나는 최근에 Tesseract 와 OpenCV를 만났습니다 . Tesseract는 본격적인 OCR 엔진이며 OpenCV를 프레임 워크로 사용하여 OCR 애플리케이션 / 서비스를 만들 수 있습니다.
내 이미지 중 일부에 Tesseract를 사용해 보았는데 그 정확성이 괜찮은 것 같습니다. 나중에 OpenCV를 사용하여 Python을 사용하여 OCR을 수행하는 방법에 대한 매우 간단한 자습서 를 보았습니다. 몇 분 만에 시스템 훈련을 마쳤고 정확도가 좋았습니다. 하지만 물론이 접근 방식을 취한다는 것은 대규모 교육 세트를 사용하여 시스템을 광범위하게 교육해야한다는 것을 의미합니다.
내 구체적인 질문은 다음과 같습니다.
- Tesseract와 OpenCV를 사용하여 맞춤형 OCR 앱을 구축하는 방법은 무엇입니까?
- 다양한 언어로 Tesseract에 사용할 수있는 교육 데이터 세트가 있습니다. OpenCV에는 OCR을 달성하기 위해 처음부터 시작할 필요가 없도록 비슷한 것이 있습니까?
- Wanna-be 상업용 응용 프로그램에 더 적합한 것은 무엇입니까?
어떤 제안?