OCR 처리를위한“반 톤”이미지 필터링

10

숨겨진 텍스트 레이어를 추가하려는 스캔 한 PDF 자료가 있으므로 문서를 색인 할 수 있습니다. 고스트 스크립트 흑백 tiff 출력 장치 (tiffg4)를 사용하여 페이지를 tiff 이미지로 추출했으며 다음은 그 모양에 대한 예입니다.

여기에 이미지 설명을 입력하십시오

테 서랙 트로이 이미지를 처리해도 좋은 결과를 얻지 못합니다.
고스트 스크립트 출력 DPI (600, 300, 150, 96)를 변경하면 96 DPI의 이미지가 tesseract에서 최상의 결과를 얻을 수 있지만 여전히 만족 스럽지는 않습니다.

이제 어떤 필터가 OCR 처리를 위해이 이미지를 향상시킬 수 있는지 조언을 구했습니다.

imagemagick 또는 numpy / scipy / ndimage를 사용할 수 있습니다

image-processing ocr

— 제타
소스

9

실제로 필요한 것은 팽창과 침식과 같은 형태 학적 조작 일 것입니다. 이것을 마감 작업 이라고 합니다 . 귀하의 경우에는 확장 자체가 좋을 수도 있습니다.

이전에 비슷한 질문이 있었는데 다른 측면에서 도움이 될 수 있습니다.

— 디판 메타
소스

2

저역 통과 필터를 사용하여이를 제거 할 수 있습니다. 그것은 주파수 공간에서 수행되거나 이미지의 가우스를 취합니다.

— 크리스토프 랙 비츠
소스