Evince에서 PDF 문서의 단어 수 얻기


22

Ubuntu의 기본 PDF 뷰어 인 Evince에서보고있는 PDF 문서의 단어 수를 얻을 수있는 방법이 있습니까? 문서를 텍스트 파일로 변환하고 터미널에서 단어 수를 얻을 수는 있지만 터미널을 사용하지 않고도 신속하게 문서를 얻을 수 있기를 원합니다. 이 작업을 수행 할 수있는 플러그인이 있습니까, 아니면 이미 내장되어 있으며 누락되었습니다?

추신 : 나는 Evince가 Ubuntu의 기본 PDF 뷰어이므로 뷰어를 변경하지 않으려 고합니다 .Evince가 포함 된 많은 응용 프로그램이 실제로 훌륭하기 때문에 기본 응용 프로그램을 사용하여 가능한 한 많이하고 싶습니다.

pdf  evince 

답변:


31

명령 행을 통해이를 수행 할 수 있습니다.

pdftotext filename.pdf - | tr -d '.' | wc -w

고맙지 만 질문에서 말했듯이 명령 줄을 사용하지 않아도됩니다.

4
@Chris evince 코드에 system ( "<command command>")을 통합 해보십시오.
Gödel

11

zenity 와 evince가 필요한 빠른 bash 스크립트는 어떻습니까 ? 인수없이 호출하면 파일을 선택할 수있는 대화 상자가 나타납니다. 인수와 함께 (또는 대화 상자 뒤에서) 호출하면 파일을 elect로 열고 단어 수를 가진 대화 상자를 제공합니다.

다시 말해, 다음을 텍스트 파일 evince-word-count.sh또는 다른 것으로 복사 하여 경로 어딘가에 저장 (예 ~/bin/:)하고 실행 가능하게 만듭니다 (노틸러스의 오른쪽 클릭 및 속성을 통해 또는로 chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

이제 노틸러스에서 일부 PDF 파일을 마우스 오른쪽 버튼으로 클릭하고 "다음으로 열기 ..."를 선택한 다음 evince-word-count.sh로 엽니 다. 이제 PDF를 열면 PDF가 모두 열리고 단어 수를 알려줍니다.

대체 텍스트


이 파일을 /home/$USER/.local/share/nautilus/scripts/에두면 Nautilus (우분투 바닐라 파일 위험)에서 마우스 오른쪽 버튼을 클릭하여 사용할 수 있습니다.
Daniel Holm

10

Evince 메일 링리스트의 Olaf Leidinger의 답변 :

나는 그러한 기능이 문서 편집기에 더 많은 정보를 가지고 있고 단어를 세는 것이 사소하기 때문에 문서 편집기에 더 적합하다고 생각합니다. PDF 파일을 예로 들어 보겠습니다. 텍스트로 보는 것은 실제로 일종의 벡터 그래픽 모양 일 수 있습니다. 텍스트가 PDF 파일에 포함되어 있어도 표시되는 단어는 여러 "위치에서 텍스트 그리기 (y, x)"명령으로 구성 될 수 있습니다 (예 : 움라우트 또는 줄 끝의 경우). 따라서 한 단어가 여러 단어로 계산 될 수 있습니다. 따라서 그러한 기능을 안정적으로 구현하기가 어려울 수 있다고 생각합니다. 내가 의미하는 바를 보려면 pdftotext를 살펴보십시오.

2
문서를 정의하는 데 사용 된 파일은 "소스 코드"로 간주 될 수 있으며 Evince는 코드를 실행하는 시스템입니다. 소스 코드 편집기 (예 : 텍스트 편집기)에 실행 결과를 결정하도록 요청하는 것은 불공평하며 불가능합니다. 따라서 출력 (예 : Evince / poppler에서 렌더링 된 이미지 / 텍스트)을 살펴 보겠습니다. 언어에 구애받지 않는 텍스트 편집기에서 내 논문을 "코딩"하고 Evince (Pandoc 및 pdflatex를 통해)를 사용하여 소스를 "실행"하기 때문에 Evince의 구현이 유용합니다. 결국 우리는 그것을 통해 무엇을했는지 확신 할 수 있습니다. 주석 처리 된 코드를 고려하십시오.
user29020

4

나는 그것이 가능하지 않다고 생각합니다 (기술적으로 가능하지만 구현되지 않았습니다).

Evince는 문서 뷰어 이고 단어 개수는 편집기 에서 더 일반적으로 필요한 기능입니다 (예, 항상 그런 것은 아님).

Evince 개발자 에게 연락 하여이 기능을 구현하는 데 관심이 있는지 물어볼 수 있습니다.


1
감사. 나는 그들에게 연락했고 결정적인 응답을 얻을 때까지 질문을 열어 두겠습니다.

답장을들을 때, 자신의 질문에 효과적으로 답하십시오. :)
8128

Evince는 "시청자"가 아닙니다. 문서를 작성하고보고 편집하는 것은 "편집"과 "보기"보다 훨씬 더 큰 작업 과정입니다. 질문과 관련하여 : Evince에서는 현재 선택한 텍스트를 복사 할 수 있습니다. 그것은 "보기"역할이 아닙니다. Evince는 우리가 실제로 읽거나 발행인에게 보내는 최종 "렌더러"이기 때문에 결과 단어 수를 찾을 수있는 좋은 위치에 있습니다. 이미 렌더링 된 전체 단어를 식별하는 방법이 있습니다 (단어를 두 번 클릭하십시오!). "파일-> 속성"상자에 이것을 제공하고 싶습니다. 이미 페이지 수 (렌더링 기반)를 알려줍니다.
user29020
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.