Java OCR 구현


160

이것은 주로 호기심이지만 순수한 Java로 OCR 구현이 있습니까? Java에서 이것이 순전히 어떻게 수행되는지 궁금하고 OCR이 일반적으로 관심이 있으니 철저히 이해하는 언어로 어떻게 구현되는지 알고 싶습니다. 당연히 이것은 구현이 오픈 소스가되어야하지만, 그 경우 최소한 성능을 체크 아웃 할 수 있기 때문에 독점 솔루션에 여전히 관심이 있습니다.

Java에서 사용할 수있는 몇 가지를 보았습니다 ( Asprise 와 같은 ). 그러나 이것이 순수한 Java 구현 인 것 같지 않습니다 ... 거기 있습니까?


@Robik 우선, 당신이 그것에있는 동안, 당신은 또한 불필요한 감사 등을 제거해야합니다. 둘째, 특히 OP가 여전히 활성화되어 있고 단순히 주석을 달 수 있다면 그러한 가정에서 편집해서는 안됩니다. 이 경우에 참 ... @ 명확하게하기 위해, 당신은 asprise를 의미 했습니까?
Tobias Kienzler

순수 자바 접근 방식을 찾지 않는다면 Tess4J 와 같은 JNI 브리지를 구축하는 것이 좋습니다. 제 느낌은 OCR 라이브러리가 C ++ 세계에서 더 잘 표현된다는 것입니다 (OCRAD, GOCR, Cuneiform – 여기 모두 참조 ).
dma_k 2012 년

@rat-맞습니다-Java 용 Asprise OCR SDK 는 순수한 Java 기반이 아닙니다. 사실, OCR은 계산 비용이 많이 드는 프로세스이므로 기본적으로 네이티브 코드가 사용됩니다.
Asprise Support

답변:


81

sourceforge.net 에서 Java OCR 프로젝트를 사용해 보는 것이 좋습니다 . 나는 처음에 그것을 개발했고 그것에 블로그 게시물이 있습니다 .

sourceforge에 올려 놓은 이후 자원 봉사자 연구원 / 개발자의 훌륭한 작업을 통해 기능이 확장되고 약간 개선되었습니다.

시도해보고 마음에 들지 않으면 언제든지 향상시킬 수 있습니다!


18
@ Ron 나는 프로젝트도 보았다. 데모를 찾지 못했고 GUI는 다양한 그래픽 작업을 수행하지만 실제 문자 인식을 얻는 방법에 대한 지침은 없습니다.
James P.

1
@Ron 블로그 링크를 따라 가면 빈 페이지가 나타납니다.
neoneye

3
@Ron 문서 나 추가 블로그 또는 자습서를 어디서 구할 수 있습니까?
altsyset 2019

1
이클립스에서 Java oc을 가져 오는 방법은 무엇입니까?
파이살 아쉬 라프

2
안녕하세요, 이것에 대한 자습서가 있습니까?
우물

10

우리는 Tesseract, Asprise, Abbyy 등과 같은 Java로 몇 가지 OCR 엔진을 테스트했습니다. 분석에서 Abbyy가 최상의 결과를 냈습니다.


1
Java API 또는 Java 구현 ..?
Ewoks

하지만을 사용하여 대화 할 수있는 명령 줄 버전은 없습니다 ProcessBuilder.
Aaron Digulla

1
Tesseract도 Abbyy도 Java 기반이 아닙니다. 그들은 단순히 Java 용 API를 가지고 있습니다.
krispy

10

매우 확장 가능한 옵션을 찾고 있거나 특정 문제 도메인이있는 경우 Java Object Oriented Neural Engine을 사용하여 직접 롤링하는 것을 고려할 수 있습니다. 다른 JOONE 참조.

개인 프로젝트 에서이 이미지와 같은 문자를 식별하는 데 성공적으로 사용했습니다 .github에서 내 응용 프로그램의 OCR 구성 요소에 대한 모든 소스를 찾을 수 있습니다 .


1
예, 감사합니다. 나는 그것을 다운로드하고 내 자신의 요구에 적응시킬 계획이다!
Amanda S

컴파일하는 방법을 보여줄 수 있습니까?
RadijatoR

프로젝트가 더 이상 @RadijatoR을 유지 관리하지 않아서 조언이 없습니다.
davetapley

4
대부분의 링크가 죽었습니다.
Erik

5

다양한 OCR 라이브러리가 있습니다. 그러나 필자의 경험은 주요 상용 구현 인 ABBYY, Omnipage 및 ReadIris가 오픈 소스 또는 기타 사소한 구현을 훨씬 능가한다는 것입니다. 이 상용 라이브러리는 Java와 작동하도록 설계되지 않았지만 물론 가능합니다.

물론 코드를 배우는 데 관심이 있다면 오픈 소스 구현으로 트릭을 수행 할 수 있습니다.


3

방금 이것을 찾았습니다 (모르고 테스트하지 말고 직접 확인하십시오)

Ron Cemer Java OCR


호기심을 위해서만 필요하면이 애플릿의 출처를 살펴볼 수 있습니다.

뉴런 네트워크로 필기 문자의 OCR을 수행합니다.

Java OCR : 필기 인식

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.