나는 내 자신의 학습 목적으로 다음과 같은 책장 이미지가 주어지면 책을 나열하는 알고리즘의 구현을 개발하려고 노력하고 있습니다.
첫 번째 단계는 이미지를 개별 책으로 자르는 것입니다.
Mathematica 에서 내 알고리즘 은 다음과 같습니다.
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- 기본 가장자리 감지 및
텍스트를 제거하고 긴 줄을 유지하십시오
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
그런 다음 원치 않는 수평선을 제거하십시오
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
그러나 결과는 크지 않습니다.
내 질문은 :
- 더 나은 결과를 얻기 위해 어떻게 이것을 개선 할 수 있습니까?
- 더 똑똑한 방법이 있습니까?
- (나중에) OCR 단계에서 정확도를 높이려면 이미지를 어떻게 더 처리해야합니까?
- 색상 정보를 사용하여 분할을 개선하는 방법은 무엇입니까?