여러 CPU 코어를 사용하여 Acrobat 11에서 OCR을 수행 할 수 있습니까?


8

OCR 처리에는 시간이 걸립니다. 여러 CPU 코어를 사용하면 처리 속도가 빨라집니다. Acrobat 10은 다중 스레드 응용 프로그램아닙니다 . Acrobat 11은 어떻습니까? 기본적으로 11은 다중 CPU 코어 (사용 가능한 경우)를 사용하여 OCR을 수행합니까? 그렇지 않은 경우 Acrobat 11이 여러 CPU 코어를 사용하여 OCR을 수행하도록하는 스크립팅과 같은 해결 방법이 있습니까? Acrobat의 내장 스크립팅 언어를 사용하거나 Acrobat의 여러 단일 스레드 인스턴스를 시작하고 처리 작업의 일부와 병렬로 연결하는 외부 스크립트를 사용합니다.

참고 :이 질문은 (1) Adobe가 새로운 주요 Acrobat 버전을 매우 자주 출시하지 않고 (Acrobat 10이 2 년 전에 릴리스 된) 2) Adobe Acrobat이 널리 사용되기 때문에 현지화되지 않았습니다 (특정 시점에 국한되지 않음). 사용 된 응용 프로그램.

답변:


6

VirtualBox에 Acrobat 11 (XI) 평가판 을 설치했습니다 . Acrobat 11은 단일 스레드입니다.

또한 여러 Acrobat 인스턴스 (CPU 코어 당 하나씩)를 시작하고 OCR 작업을 병렬 처리하고 결과를 병합하는 외부 스크립트를 만들었습니다. 중요한 단계는 Acrobat 환경 설정에서 오류 로깅을 켜고 모든 .log를 구문 분석 한 후 오류 파일을 다시 처리하는 것입니다. 스크립트 (4 개의 코어를 사용하는 경우)는 여전히 Acrobat 11 기본값보다 2 배 이상 빠른 OCR을 수행합니다.


4
원하는 경우 소스를 제공 할 수 있습니다. 그들이 감히 제거하면 쉽게 복원 할 수 있습니다.
Joey

또한 질문을 게시 한 사람과 동일한 사람인 경우 현재 등록되지 않은 두 계정을 새로 등록 된 계정에 병합하는 것이 좋습니다. 당신은 시작할 수 있습니다 여기에 , 또한 읽기 자세한 내용은. 그 후에는 적절하다고 생각되는대로 질문을 수정할 수 있습니다.
Indrek

나는 아무것도 방해하려고하지 않습니다. 사용자 이름을 계속 변경했기 때문에 수정 한 내용은 원래 질문을 이해하지 못하는 제 3자가 작성한 것으로 보입니다. 또한 자신의 질문에 대답하려면 질문을 작성하고 한 번에 모두 대답해야합니다.
Isaac Rabinovitch

현재 귀하의 (등록되지 않은) 계정을 병합했습니다. 그러나 일회용 전자 메일 주소를 사용하지 말 것을 요청하지만 당사 사이트에 등록하면 로그인 상태를 유지하고 질문에 대한 의견을 남기실 수 있습니다. 또한 제거 할 것이없고 걱정할 것도 없습니다. 익명 편집은 항상 더 엄격하게 검토됩니다.
slhck

1
@tarcman 스크립트를 게시 할 가능성이 있습니까? 나는 그것을 사용하는데 관심이있는 많은 사람들이 있다고 확신한다
Jason

1

멀티 스레딩은 응용 프로그램에 내장되어야합니다. 개발자는 스레드를 생성하고 각 스레드에 할당 할 수있는 하위 작업으로 작업을 분류하는 코드를 작성해야합니다. Acrobat 개발자가 OCR 인식 코드로이 작업을 수행하지 않으면 사용자가 필요한 추가 논리를 만들 수있는 방법이 없습니다.


2
여러 페이지에 적용 할 수 있다면 작업을 여러 프로세스로 분할하려고 시도 할 수 있습니다. 각 OCR은 몇 페이지에 불과한 후 결과를 다시 병합합니다.
Joey

0

OCR에 모든 코어를 사용하려면 PDF-Exchange Editor를 참조하십시오. OCR 엔진이 시스템의 모든 코어를 사용하는 것으로 보입니다. 이 수준의 성능에 도달하면 SSD를 사용하는 것이 좋습니다.

I / O 바인드되지 않은 단일 스레드 응용 프로그램에 더 많은 CPU 시간을 사용하게하는 Windows 조정이 있어야합니다. 내 시스템에서 Acrobat은 디스크 성능에 의해 느려지지 않지만 색인을 작성하는 데 가장 많은 CPU 시간은 약 30 %입니다.

Acrobat은 널리 사용되지만 제대로 작성되지 않은 응용 프로그램입니다. Acrobat Pro에는 아직 다른 곳에서는 얻을 수없는 몇 가지 기능이 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.