이미지를 텍스트로 변환


8

은행에서 스캔 한 이미지 문서를 얻었고 우분투의 이미지가있는 일반 텍스트 문서로 변환하고 싶습니다.

어떤 도구가 있습니까?

답변:


15

가 있습니다 OCR의 텍스트를 이미지로 변환 할 수 있습니다 리눅스에 대한 독자. 다음 옵션을보십시오 :

문어를 제외한 위의 모든 것은 동일한 이름의 패키지로 Ubuntu 저장소에 있습니다.

독자마다 다른 이미지 형식을 지원하므로 문서의 파일 형식에 따라 옵션이 제한 될 수 있습니다. 또는 특정 OCR 리더를 사용하려는 경우 ImageMagick 의 변환 도구를 사용하여 형식을 변경할 수 있습니다.

내 대답 에서 적응했습니다 .


0

먼저 리눅스 머신에 "tesseract-ocr"을 설치해야합니다.

sudo apt-get install tesseract-ocr

CLI에서 수동으로 수행하거나 동일한 PHP 코드를 만들었으므로 원하는 경우 사용할 수 있습니다.

참고 :이 코드를 실행하려면 php.ini에서 exec 명령을 활성화해야합니다.

<?php
//IMAGE TO TXT Conversion
    $input_file = $_REQUEST['input_file'];
    $out = explode(".",$input_file);

    $output_file = $out[0]."_".$out[1];
    $output_file_name  =    $output_file.".txt";

    echo "<br />----IMAGE To TXT conversion Started-----</br />";
    echo  exec('tesseract '.$input_file.' '.$output_file);
    echo "<br />----TXT conversion Done-----</br />";

    echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
    echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; 
?>

이 코드를 루트 폴더에 넣고 브라우저에서 액세스하십시오.

예 :

http://yourserver.com?input_file=1.png

참고 : 1.png 파일이 현재 디렉토리에 있어야합니다.

나는 이미지를 업로드 할 권리가 없다. 나는이 이미지를 참조로 사용했다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.