Microsoft Word에서 Grep?


10

Microsoft Word에서 Grep?

단어 문서에서 주어진 문자열이있는 모든 줄을 가져 가고 싶습니다. 유닉스 세계에서 ... grep은 결함없이 이것을합니다. Windows는 나에게 분명하지 않습니다.

답변:


10

Cygwin (또는 Linux 시스템에 액세스)을 사용하면

antiword file.doc | grep "my phrase"

또는

catdoc file.doc | grep "my phrase"

비슷한 방식 으로 grep 하기위한 명령 행 파일 형식 변환기가 많이 있습니다 .

순수하게 In-Word 솔루션은 Ctrl + F (찾기) 후 모두 찾기 가 될 수 있지만 모든 버전의 MS Word에 모두 찾기 버튼 이 있는지 확실하지 않습니다 .


2
질문 제목을 보았을 때 "Ha! 좋았을 것입니다."라고 생각했습니다. 다시는 GNU 프로그래머를 과소 평가해서는 안됩니다.
Phoshi 2018

내가 제공하는 catdoc모든 .doc/ .docx파일 의 최신 segfaults 버전은 antiword내 문서에 "단어 문서가 아닙니다"라고 알려줍니다. 다른 옵션에 대해 알고 있습니까?
detly

내가 사용한 것 없음 ... docx2txt데비안 리포지토리에있는 빠른 검색 쇼 가 작동 할 수 있습니다. 또한 동일한 목적으로 사용될 수있는 OpenOffice / LibreOffice 명령 줄 형식 변환 유틸리티 (unoconv)도 살펴 봅니다.
크로노스

3

나는 이것이 원시적 인 것처럼 들리지만 파일을 .txt로 저장 한 다음 원하는대로 파일을 추출하지 못하게합니다.


2
그것을 위해 수백 가지를 갖는 것이 무엇입니까.
tchrist

1

단어 문맥에서 "줄"은 무엇을 의미합니까? 표시되는 행은 페이지 서식에 어떤 작업을 수행하면 변경됩니까? 단락? 다른 것?

서식 및 기타 명확하지 않은 사항 변경을 포함하여 Word의 찾기 및 바꾸기 기능을 사용하여 많은 작업을 수행 할 수 있지만 모든 텍스트는 주변 텍스트가 아닌 찾기 텍스트에만 작용합니다.


grep은 그 정규 표현식을 좋아합니다!
Phoshi 2018

1

무료 오픈 소스 도구로 개발 한 CRGREP 에는 MS 문서 (Word, PowerPoint, Excel)가 지원됩니다 . 또한 데이터베이스 테이블, 이미지, 오디오, 아카이브, PDF 및 이들의 조합과 같은 검색하기 어려운 다른 항목을 greps합니다. 즐기세요



0

의견을 말할 충분한 담당자가 없지만이 문서와 docx 문제에 대해 논의 했으므로 스레드를 쫓는 사람이 도움이 될 수 있습니다.

docx 파일에는 특별한 도구가 필요하지 않습니다. docx는 압축 된 XML 파일입니다.

XML을 추출하고 제거하려면 다음을 기반으로 무언가를 시도하십시오.

unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'

에서 명령 줄 쿵푸


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.