Ubuntu 12.10에서 입력하면 gnome-screenshot -a | tesseract output 다음을 반환합니다. ** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11. 화면에서 텍스트를 선택하여 텍스트 (클립 보드 또는 문서)로 변환하려면 어떻게해야합니까? 고맙습니다!
이미지에서 텍스트를 추출하려면 어떻게합니까? 나는 스캔 한 파일에 대해 이야기하는 것이 아니라 수업 시간에 칠판을 고화질로 찍을 때와 같은 정원의 다양한 이미지에 대해 이야기하고 있습니다. 또는 레시피 북에서 페이지를 촬영하고 텍스트 형식의 레시피를 원할 때. 이를위한 무료 및 공개 소프트웨어가 있습니까? 나는 tesseract를 시도했고 결과는 끔찍했습니다.
PDF로 스캔 한 문서가 많이 있으며 검색 할 수 있기를 원합니다. 어떻게해야합니까? 본질적으로 나는 pdf를 OCR 한 다음 추출 된 텍스트를 새로운 pdf로 다시 혼합해야합니다. 여러 가지 다른 솔루션 ( PDF에 OCR 정보 추가 에서 찾은 솔루션 포함)을 성공적으로 시도하지 못했습니다 . pdfocr (이 문제는 https://github.com/gkovacs/pdfocr/issues/7 ) pdfsandwich (소프트웨어 센터에서 …
Tesseract뿐만 아니라 gscan2pdf v1.3.9를 설치했습니다. 후자는 먼저 설치된 소프트웨어 목록의 맨 아래에 표시되었지만 여전히 작동하지만 사라지는 것 같습니다. 어쨌든 스캔 한 문서의 PDF를 편집 가능한 텍스트로 바꾸려고하지만 문서가 영어가 아니므로 gscan이 엉망이됩니다. 내가 갈 때 옵션 만 내가 얻을 수 Tools > OCR > Language to recognize있다 English, equ그리고 osd. …
모든 계정에서 tesseract는 훌륭합니다. 그러나 내 결과는 어둡습니다. png로만 가지고있는 텍스트 (책과는 반대로 디지털)를 변환해야합니다. 예를 들어 : 2 3 academics 1 1711 2 3 Achlmbobelmann 211 191—2 1 3 Aoqusmono|Food 1 171 n 5 AFD.seeAgem:eFIan§asedeDével 1 (muessmm) 3 4 allluence 211 I849 81 5 Afnca 33:21 9.lZ3l.$50Z55&9l.93-4.9898100.II8r2D.IZ§£ 이것은 흰색 …