많은 페이지를 PDF 파일로 바로 스캔 할 수있는 사용하기 쉬운 프로그램이 Ubuntu에 있습니까?
많은 페이지를 PDF 파일로 바로 스캔 할 수있는 사용하기 쉬운 프로그램이 Ubuntu에 있습니까?
답변:
나는 xsane
이 질문을 보았을 때 사용하고 있었고 인터페이스가 가장 적지 만 효과적이라고 생각했습니다.
이 질문을 보았을 때 우분투 루시드 / 매버릭 저장소에 살고있는 gscan2pdf를 찾았 습니다 . 그것은 동일한 스캐닝 (libsane) 엔진을 사용하지만 UI는 훨씬 그놈입니다. 좋은 시간을 보내려면 다음을 시도하십시오.
sudo apt-get install gscan2pdf
단순 스캔의 저장 대화 상자 에서 파일 이름을 myfile.jpg에서 myfile.pdf로 변경하십시오 .
Ubuntu 14.04, Simple Scan 3.12.1에서 테스트되었습니다.
파일 형식 드롭 다운에 "PDF"가 표시되지 않고 "이미지"만 표시되는 경우에도 작동합니다. 나는 이것을 UI 버그라고 생각합니다.
이 기능은 다음에 설명되어 있습니다 Help > Contents
.
"다른 이름으로 저장"대화 상자에서 지원되는 파일 형식 중 하나를 선택하거나 "이름"필드에서 확장명을 변경하십시오.
다음과 같은 형식이 지원됩니다.
흥미로운 사실 : 스캔 유형 ( "스캔"옆의 드롭 다운)을 "텍스트"로 변경하면 기본 파일 유형이 PDF가됩니다.
USB 스캐너에서 페이지를 스캔하십시오. PDF로 OCR에 tesseract를 사용하십시오. 여러 페이지를 하나의 PDF로 병합합니다. 사용법 : scan2PDF outputfilename number_of_pages
#!/bin/bash
#scan2PDF
#Requires: tesseract 3.03 for OCR to PDF
# scanimage for scanning, I use 1.0.24
# pdfunite to merge multiple PDF into one, I use 0.26.5
#
# Use scanimage -L to get a list of devices.
# e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
# then copy/paste genesys:libusb:006:003 into SCANNER below.
# play with CONTRAST to get good images
DPI=300
TESS_LANG=nor #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003 #My USB scanner
CONTRAST=35 #Contrast to remove paper look
FILENAME=$1 #Agrument 1,filename
PAGES=$2 #Argument 2, number of pages
re='^[0-9]+$' #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi
SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp
if [ -d ${TMP_DIR} ] #Check if it exists a directory already
then
echo Error: The directory ${TMP_DIR} exists.
exit 2
fi
mkdir ${TMP_DIR} #Make and go to temp dir
cd ${TMP_DIR}
echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt
echo Starts Tesseract OCR
for file in *.tif #Goes through every tif file in temp dir
do
tesseract $file ${file%.tif} -l ${TESS_LANG} pdf
done
if [ "$PAGES" = "1" ] #How many pages
then
cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back
else
for file in *.pdf #More pages, merge the pages into one PDF and copy back
do
pdfuniteargs+=${file}
pdfuniteargs+=" "
done
pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
echo ${FILENAME}.pdf done
rm * #Done, clean up
cd ..
rmdir ${TMP_DIR}
XSANE를 사용하려는 사람들을 위해. 프로그램의 도움말> XSane Doc에서 링크 된 설치 안내서를 읽고 얼마나 많은 작업을 수행 할 수 있는지 알면 매우 강력하고 직관적입니다. SANE 백엔드가 올바르게 작동하는지 확인하는 것도 가치가 있습니다 (아치에 국한되지 않음) : https://wiki.archlinux.org/index.php/SANE
피더에서 문서를 자동으로 스캔하고 XSane이 중지시기를 알고 (너무 일찍 중지하지 않는지) 궁금한 경우 왼쪽 상단 (스캔 수 아이콘)에 맞는 페이지 수보다 큰 숫자를 입력하십시오. 피더에. 즉, 피더가 10 페이지를 차지할 수 있으면 15를 입력하여 두께 편차를 고려하십시오. 양면 스캐너가있는 경우이 수를 두 배로 늘리십시오.
피더가 다 떨어지면 ""스캔 페이지 : 0 "이라는 녹색 경고 삼각형이있는 대화 상자가 나타납니다. 이는 피더가 비어 있고 대화 상자를 닫을 수 있음을 의미합니다."뷰어 "또는"저장 "을 선택한 경우 "는 XSane의 오른쪽 상단에 있으며 파일이 모두 표시됩니다. 뷰어에서 파일을 저장해야합니다. 이제 스캔을 다시 눌러 같은 지점에서 숫자가 증가한 상태에서 중단 한 부분을 다시 시작하거나 시작할 수 있습니다. 빈 페이지가 추가되지 않습니다 "다중 페이지"를 선택한 경우 프로젝트 대화 상자에 완료된 모든 스캔이 표시되고 클릭하면 여러 페이지 PDF, TIFF 또는 PostScript로 저장할 수 있습니다.
HTH,
DC