답변:
나는을 사용하는 것보다 더 나은 것을 알지 pdftotext
못하지만 그 less
일을 꼬집어 일합니다. 다른 변환기도 있습니다. 어쩌면 pdftohtml
및 lynx
/ links
/ elinks
/ links2
/ w3m
(텍스트 모드 브라우저) 몇 가지 물건보다 "렌더링"수 있습니다.
내가 찾을 수있는 모든 도구라는 설치하는 것을 포함한다 오히려 hackish 솔루션 번호 pdftohtml
또는 pdftotext
결과 파일을 다음보기.
따라서 사용중인 Linux의 맛이 pdftohtml인지 확인하십시오.
pdftohtml ch.01.pdf
뒤에
lynx ch.o1.html
( http://bassemreda.wordpress.com/2009/03/06/console-pdf-viewer/에 있음 )
인터넷 검색 console pdf viewer
은 콘솔 pdf 뷰어가 없다는 페이지 만 반환하며 서식을 유지하거나 텍스트를 추출하려면 위와 같이 html로 변환하는 것이 가장 좋습니다.