많은 페이지를 PDF로 바로 스캔


35

많은 페이지를 PDF 파일로 바로 스캔 할 수있는 사용하기 쉬운 프로그램이 Ubuntu에 있습니까?


우분투에서 사용하려는 스캐너 / 프린터에 필요한 특별한 자격이 있습니까?
JFW

@JFW, 대부분의 우분투 스캐너에서 사용하는 백엔드 XSane 에 지원되는 장치 목록이 있습니다. 원하는 경우 HP 프린터 / 스캐너 / 복사기가 안정적인 선택으로 보입니다.
poolie

답변:


38

단순 스캔 유틸리티를 사용한다는 아이디어는 기본적으로 10.04부터 (응용 프로그램 ‣ 그래픽 ‣ 단순 스캔)에 설치된 스캔 도구 인 Simple Scan 의 개발을 뒷받침했습니다 . 대체 텍스트

원하는만큼 페이지를 스캔하고 저장시 PDF를 파일 형식으로 선택하십시오.

텍스트 인식과 같은 추가 기능을 제공하는 약간 덜 간단한 또 ​​다른 프로그램 은 리포지토리에서도 gscan2pdf 입니다. 대체 텍스트


3
단순 스캔의 경우 +1-매우 쉽고 간단하지만 매우 강력합니다. 특히 언급 한 작업에 적합합니다.
8128

5

"사용하기 쉬운"은 사용자의 눈에 있지만 xsane이 기능을 제공합니다. 뷰어라고하는 곳에서 여러 페이지를 선택하거나 CTRL-M을 누르십시오. 여기에서 알아 내기가 어렵지 않아야합니다.


개인적으로 나는 xsane이 사용하기 쉬운 것보다 먼 것을 본다 ...
8128

이번에는 xsane을 사용하고 있습니다. 더 좋은 도구가있을 수는 없었습니다.
Amanda

3

나는 xsane이 질문을 보았을 때 사용하고 있었고 인터페이스가 가장 적지 만 효과적이라고 생각했습니다.

이 질문을 보았을 때 우분투 루시드 / 매버릭 저장소에 살고있는 gscan2pdf를 찾았 습니다 . 그것은 동일한 스캐닝 (libsane) 엔진을 사용하지만 UI는 훨씬 그놈입니다. 좋은 시간을 보내려면 다음을 시도하십시오.

sudo apt-get install gscan2pdf

3

단순 스캔의 저장 대화 상자 에서 파일 이름을 myfile.jpg에서 myfile.pdf로 변경하십시오 .

Ubuntu 14.04, Simple Scan 3.12.1에서 테스트되었습니다.

파일 형식 드롭 다운에 "PDF"가 표시되지 않고 "이미지"만 표시되는 경우에도 작동합니다. 나는 이것을 UI 버그라고 생각합니다.

이 기능은 다음에 설명되어 있습니다 Help > Contents.

"다른 이름으로 저장"대화 상자에서 지원되는 파일 형식 중 하나를 선택하거나 "이름"필드에서 확장명을 변경하십시오.

다음과 같은 형식이 지원됩니다.

  • PDF
  • JPEG
  • PNG
  • 사소한 말다툼

흥미로운 사실 ​​: 스캔 유형 ( "스캔"옆의 드롭 다운)을 "텍스트"로 변경하면 기본 파일 유형이 PDF가됩니다.


1

USB 스캐너에서 페이지를 스캔하십시오. PDF로 OCR에 tesseract를 사용하십시오. 여러 페이지를 하나의 PDF로 병합합니다. 사용법 : scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

그것은 매우 Linuxoidal 방법입니다
rth

1

XSANE를 사용하려는 사람들을 위해. 프로그램의 도움말> XSane Doc에서 링크 된 설치 안내서를 읽고 얼마나 많은 작업을 수행 할 수 있는지 알면 매우 강력하고 직관적입니다. SANE 백엔드가 올바르게 작동하는지 확인하는 것도 가치가 있습니다 (아치에 국한되지 않음) : https://wiki.archlinux.org/index.php/SANE

피더에서 문서를 자동으로 스캔하고 XSane이 중지시기를 알고 (너무 일찍 중지하지 않는지) 궁금한 경우 왼쪽 상단 (스캔 수 아이콘)에 맞는 페이지 수보다 큰 숫자를 입력하십시오. 피더에. 즉, 피더가 10 페이지를 차지할 수 있으면 15를 입력하여 두께 편차를 고려하십시오. 양면 스캐너가있는 경우이 수를 두 배로 늘리십시오.

피더가 다 떨어지면 ""스캔 페이지 : 0 "이라는 녹색 경고 삼각형이있는 대화 상자가 나타납니다. 이는 피더가 비어 있고 대화 상자를 닫을 수 있음을 의미합니다."뷰어 "또는"저장 "을 선택한 경우 "는 XSane의 오른쪽 상단에 있으며 파일이 모두 표시됩니다. 뷰어에서 파일을 저장해야합니다. 이제 스캔을 다시 눌러 같은 지점에서 숫자가 증가한 상태에서 중단 한 부분을 다시 시작하거나 시작할 수 있습니다. 빈 페이지가 추가되지 않습니다 "다중 페이지"를 선택한 경우 프로젝트 대화 상자에 완료된 모든 스캔이 표시되고 클릭하면 여러 페이지 PDF, TIFF 또는 PostScript로 저장할 수 있습니다.

HTH,

DC

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.