문서 스캐닝 : 스캐닝 프로세스의 소프트웨어 부분을 빠르게하는 방법은 무엇입니까? [닫은]


0

특히 자동 문서 공급기 (ADF)가있는 일반 문서 스캐너에 적합하지 않은 문서의 경우, 문서 스캔 프로세스 속도를 높이는 솔루션을 찾고 있습니다. 이러한 문서의 경우 현재 플랫 베드 스캐너를 사용하고 있습니다.

처음에는 더 빠른 스캐닝 하드웨어가 해결책이라고 생각했습니다 (예 : 일반적인 평판 스캐너 대신 카메라 스캐너). 그러나 스캔을위한 총 시간은 스캔 하드웨어의 20 % (스캔 헤드의 움직임)로만 이루어졌지만 소프트웨어 (이미지 향상 및 광학 문자 인식)의 경우 80 %로 나타났습니다.

스캔 속도를 높이기 위해 다음을 조사했습니다.  (a) CPU의 코어 / 스레드 하나뿐 아니라 다중 코어 / 스레드를 사용하는 소프트웨어 스캔. 광범위한 검색에도 불구하고 TWAIN 용 멀티 스레드 프로그램을 아직 찾을 수 없습니다.  (b) 워크 플로우 + 소프트웨어 : 내 자신의 스캔 프로파일을 정의 할 수있는 프로그램. 그러나 나는 아직 소프트웨어를 찾을 수 없었다.    프로필을 스캔하고 동시에 좋은 자동 자르기 (및 OCR 안 함    영어로만). (c) 워크 플로우 즉, OCR을 별도의 단계로 이동합니다 (그러나 CanoScan 플랫 베드 스캐너와 번들로 제공되는 소프트웨어가 OCR 포함 여부와 관계없이 스캔 할 때 동일한 시간이 걸리기 때문에 속도가 향상되지 않았습니다)

스캔 속도를 어떻게 높일 수 있습니까?

시장에서 제 3 자 문서 스캐닝 소프트웨어를 아는 사람들에게 : i7 듀얼 코어와 i7 쿼드 코어 CPU 간의 속도면에서 상당한 차이가 있습니까?

문서 스캐닝 소프트웨어로서 이미지 강조 기능 (예 : 기울기 보정, 자동 자르기, 화면 제거), OCR (영어 만 해당), 여러 파일 형식 (jpg, jpeg2000, TIFF, 검색 가능한 PDF , PDF / A) 및 스캔 프로파일 (= dpi, 이미지 향상 설정, OCR 언어, 파일 유형의 사용자 정의 조합).


한 가지 질문은 "시장에 서드 파티 문서 스캐닝 소프트웨어를 알고있는 사람들에게 : i7 듀얼 코어와 i7 쿼드 코어 CPU의 속도면에서 상당한 차이가 있습니까?" 또 다른 질문은 마지막 단락에서 내가 지정한 사양의 소프트웨어 권장 사항에 관한 것입니다.
user291737

"같은 속도의 단일 코어 프로세서는 듀얼 또는 쿼드 코어 프로세서와 동일한 속도로 1/2 및 1/4 속도로 작동합니다." 시장에서 문서 스캐닝 소프트웨어로 실제 경험을 요구했습니다. 문서 스캐닝 소프트웨어를 사용하는 현실 세계에서 : i7 듀얼 코어와 i7 쿼드 코어 CPU간에 속도면에서 상당한 차이가 있습니까?
user291737

i7 쿼드 코어 CPU의 잠재력을 완전히 사용하는 문서 스캔 소프트웨어에 대해 알고 있다면 알려주십시오.
user291737

또 다른 옵션은 별도로 스캔하고 후 처리 할 수있는 소프트웨어입니다. 내 문서 스캐너 소프트웨어를 사용하면 스캔 한 다음 나중에 전체 파일 그룹에 대해 OCR을 수행 할 수 있습니다. OCR을해야하는 경우 스캔을 수행 한 다음 하루 종일 종료하기 전에 OCR 배치를 동작으로 설정하십시오. 그 시점에서 나는 그것이 다음날에 돌아갈 때까지 끝내는 한 시간이나 8 시간이 걸릴 지 비판적입니다.
Steve Rindsberg

또한 속도 문제가있는 경우 해당 ISIS ( en.wikipedia.org/wiki/Image_and_Scanner_Interface_Specification ) 드라이버 대신 TWAIN 드라이버를 사용하십시오.
JSanchez

답변:


2

먼저 스캔 프로세스를 사후 처리 프로세스와 분리하십시오. 더 높은 해상도 300-600DPI 이상으로 사진을 스캔하여이를 수행하십시오. 파일은 커지지 만 게시 프로세스가 끝날 때까지 일시적입니다. 파일 크기가 가장 느려지므로 해상도와 비트 심도를 가능한 한 낮게 떨어 뜨리십시오. (예 : 색상이 필요없는 경우 회색 스케일 사용). 당신이 원하지 않는 것은 8-1 / 2 "x11"의 24bit 1200DPI 이미지입니다. 그들은 저장하고 열려면 너무 오래 걸립니다.

그런 다음 사용자의 필요에 맞는 소프트웨어를 사용하여 편리하게 일괄 적으로 사후 처리를 실행하십시오. 모든 소프트웨어 기능이 다르기 때문에 소프트웨어를 배우셔야합니다.

그래도 캐치가 있습니다. 대부분의 프로그램은 멀티 코어 CPU의 1 코어에서만 실행되므로 프로그램을 여러 번 실행하고 프로그램의 열린 인스턴스간에 배치를 분할하는 것이 가장 빠른 방법입니다. 대부분의 프로그램은 다중 인스턴스를 열지 않으므로 시작 메뉴에서 수동으로 실행하거나 특수 "스위치"로 실행 명령에서 프로그램을 실행해야합니다. 프로그램에 따라 어떻게하는지에 따라 다릅니다. 인스턴스가 이미 열려 있으면 새 인스턴스를 열려면 예를 들어 Acrobat을 실행 명령에서 "ACROBAT / N"으로 실행해야합니다.

프로세스를 게시하는 데 10,000 페이지 이상이있는 경우 하루 동안 4 코어 컴퓨터에서 3 개의 인스턴스를 열고 3 인스턴스에서 작업을 분할하여 컴퓨터를 사용할 수 있습니다 (CPU는 75 %에서 25 % "사무실 사용"). 밤에는 최대 4 개의 인스턴스를 실행하여 컴퓨터를 종료합니다.

그러나 후 처리가 그렇게 오래 걸리지 않을 것이라는 것을 알고 있다면 단 몇 시간 만에 인스턴스를 열어서 고민하지 않을 것입니다. 간단히 배치를 실행하고 완료 될 때까지 기다립니다. 이중 코어 컴퓨터를 사용하면 사후 처리를 실행하고 컴퓨터를 계속 사용할 수 있습니다. 대부분의 배치는 그리 오래 걸리지 않을 것입니다. 듀얼 코어 컴퓨터에서 2-3 인스턴스를 실행하는 경우 배치가 완료 될 때까지 컴퓨터가 활성 사용을위한 바탕 화면으로 작동하지 않을 수 있습니다.

또 다른 옵션은 인스턴스 실행 여부에 상관없이 Windows 작업 관리자로 이동하여 인스턴스의 CPU 우선 순위를 보통보다 낮게 변경하여 현재 작업이 백그라운드 작업보다 우선합니다.

속도는 더 많은 코어가 작동할수록 처리 속도가 빨라집니다. 문제는 단일 스레드 응용 프로그램을 실행하는 듀얼 코어 CPU가 있고 비슷한 쿼드 코어를 구입하여 같은 방식으로 동일한 응용 프로그램을 실행하면 더 빨리 진행되지 않는다는 것입니다. 그래서 트릭은 CPU의 성능을 최대화하기 위해 동시에 여러 번 싱글 스레드 응용 프로그램을 실행하는 것입니다.

사후 처리가 끝나면 이미지를 삭제하기 전에 원하는 형식으로 문서를 저장 한 다음 QC 일괄 처리를 저장하십시오.

Acrobat을 사용하고 대규모 배치를 실행하는 경우 문제가 발생해도 준비하십시오! 해결책을 찾고 동일한 문제가있는 사람들을 더 찾으십시오! Acrobat은 고통입니다!


귀하의 유능한 답변을 많이 주셔서 감사합니다 !!! 나는 많은 스캔 프로그램들이 하나의 쓰레드만을 실행한다는 것을 알고 있었다. 그래서 여러 스레드를 실행하는 소프트웨어에 대한 힌트를 얻으려고했습니다. 스캔 시장은 10 ~ 20 년 된 코드가 포함 된 많은 레거시 응용 프로그램에서 아주 특이한 것으로 보이며 이러한 소프트웨어를 판매하는 회사는 최신 CPU의 잠재력을 최대한 활용하도록 업그레이드하지 않습니다. 여러 인스턴스를 시작할 수 있다는 것을 알지 못했습니다. 많은 감사드립니다!
user291737

RAM에 관한 질문 : 8GB가 충분한가 또는 16GB 또는 32GB의 경우 더 빠를까요?
user291737

ABBYY FineReader 11 및 Omnipage 18 / Professional 18 / Ultimate은 멀티 코어 프로세서를 지원한다고 주장합니다. 당신은 그들과 어떤 경험이 있습니까?
user291737

@ user291737 Autocad Architecture는 단일 스레드 인 6,000 $ + 디자인 프로그램이므로 단일 스레드 인 10-20 년 된 프로그램이 아닙니다. Adobe Acrobat도 단일 스레드입니다. RAM은 당신이 충분하다면 아무런 효과가 없을 것입니다. Windows 리소스 모니터에서 메모리가 충분한 지 확인하십시오. 사무실 컴퓨터의 경우 99 % 정도면 8GB 정도면 충분합니다. 내가 언급 한 프로그램에 익숙하지 않습니다.
Damon

후 처리 과정이 OCR로 제한되어 있습니까? 아니면 후 처리 과정에서 이미지 향상 (예 : 디 화면, 자동 축소, 자동 자르기)을 수행합니까? 나는 300 dpi의 스크린 인쇄기로 평판 스캐너를 사용하여 한 페이지의 스캔 + 처리를 완료하는 데 필요한 시간이 거의 두 배가되는 것을 알아 챘습니다. descreen을 별도의 후 처리 단계로 옮길 수 있다면 많은 시간을 절약 할 수 있습니다. 정기적으로 descreen을 사용합니다 (예 : 잡지에서 텍스트 및 그래픽이 포함 된 페이지를 스캔 할 때). 파일 크기를 상당히 줄일 수 있습니다.
user291737
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.