CLI에서 odt, doc, docx 및 기타 사무 문서의 페이지 수를 어떻게 확인할 수 있습니까?


13

명령 행에서 PDF 문서의 페이지 수를 쉽게 찾을 수 있습니다.

pdfinfo sample.pdf | grep ^Pages:

...하지만 odt파일 및 기타 사무 문서에 대해 비슷한 방법을 찾을 수 없었습니다 .

프로그래밍 방식으로 이러한 문서의 페이지 수를 결정하는 방법이 있습니까?

답변:


10

모든 답변 감사합니다. 귀하의 도움으로 거의 모든 관련 사무실 문서에서 페이지 수를 추출 할 수있는 명령 목록을 컴파일 할 수있었습니다.

DOCX / PPTX

unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'

unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'

참고 : unzip로 설치할 수 있습니다 sudo apt-get install unzip.

DOC / PPT

wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'

wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'

참고 : wvSummary(대소 문자 구분!)는 wv패키지의 일부입니다 . 로 설치하십시오 sudo apt-get install wv.

ODT

unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'

PDF

pdfinfo sample.pdf | grep -oP '(?<=Pages:          )[ A-Za-z0-9]*'

참고 : 우분투의 pdfinfo일부이며 poppler-utils미리 설치되어 있어야합니다.

DJVU

djvused -e "n" sample.djvu

참고 : 패키지의 djvused일부이며 djvulibre-bin로 설치 될 수 있습니다 sudo apt-get install djvulibre-bin.


6
unzip -p document.odt meta.xml | grep -o 'page-count="[0-9]*"'

자세한 내용은 여기를 참조하십시오 .


링크 주셔서 감사합니다! 그것은 매우 흥미로운 읽기였습니다. 나는 당신의 대답을 받아 들였을 것이지만 다른 사무실 문서에 대한 몇 가지 멋진 명령을 찾아 내 자신의 대답으로 컴파일했습니다. 나는 당신이 상관하지 않기를 바랍니다.
Glutanimate

5

odt파일 정보 를 추출하는 방법을 찾지 못했지만 파일 과 함께 pdfinfo사용할 빠른 스크립트를 만들어 각 odt 파일을 PDF로 변환 한 다음 나중에 사용하지 않을 경우 변환 된 파일을 삭제할 수 있습니다.pdfinfoodt

libreoffice --headless --invisible --convert-to pdf sample.odt
pdfinfo sample.pdf | grep ^Pages:
rm sample.pdf

이것이 도움이 되었기를 바랍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.