Word 문서에 해당하는 "소스보기"?


11

때로는 레이아웃이 상당히 복잡해지고 문서가 수작업 및 / 또는 버전을 몇 차례 변경했을 때 Word 문서가 다소 중단 된 것처럼 보입니다. 실제로 작동해야하는 문서의 특정 위치에서 Backspace또는 Enter키를 눌렀을 때 아무 일도 일어나지 않거나 서식이 무작위로 적용되거나 재설정되는 것처럼 보일 수 있습니다. 우리 모두 거기에 있었던 것 같아

Word에서 실수로 발생하는 일이 매우 불투명하기 때문에 무엇이 잘못되었는지 정확히 아는 것이 매우 어려울 수 있습니다. 비어있는 문서를 가질 수 있지만 실제로는 서식 등에 관한 기본 상태가 매우 복잡 할 수 있습니다.

이 경우 페이지에 표시된 내용의 소스 코드를 살펴 보는 것이 좋습니다. 브라우저에서 소스보기 를 수행하는 방법과 마찬가지로 소스 코드에서 직접 편집 할 수있는 것이 이상적입니다 (예 : 라텍스 사용시의 방식). Microsoft Word 문서 용 View Source 유형 명령 또는 유틸리티가 있습니까?

내 생각에 그런 명령이 없거나 그것에 대해 들었을 것입니다. 그렇다면 Word 문서에서 성가신 "숨겨진 서식"을 파악하는 데 좋은 접근 방법이 있습니까?

.doc 및 .docx 형식에 약간의 차이가있을 수 있습니다. 두 경우 모두에 관심이 있습니다.

답변:


11

포맷하면 주로에 관심이 무엇 인 경우 말씀은 텍스트에 적용된 서식의 모든 유형을 검사하기위한 좋은의 feture을 가지고와라는 개체 서식 공개 . Word 2007 및 2010에서이 패널의 바로 가기는 Shift+ F1입니다.

여기에 이미지 설명을 입력하십시오

그렇지 않으면 문서 형식에 대한 더 깊은 이해를 찾고 있다면 DOCX 파일 용 XML을 볼 수 있습니다.

  1. 디스크에서 DOCX 문서를 찾으십시오.
  2. 문서의 확장자를 .docx에서 .zip으로 변경하십시오.
  3. 파일을 두 번 클릭하고 기본 아카이브 관리자에서여십시오.
  4. zip 프로그램에서 "Word"폴더로 이동하여 Document.xml을여십시오 . 다른 파일들도 스타일이나 글꼴 정보와 같은 다른 방법으로 사용 되기는하지만 이것은 문서 내용의 대부분을 구성하는 코드입니다.

데이터를 보려면 적절한 XML 편집기가 필요합니다. 심지어 매우 복잡하고 큰 문서의 경우 매우 길 것입니다.

DOC에 대해서는 별도의 스트림으로 구성된 이진 파일이므로 "소스를 보는"쉬운 방법이 없으므로 내용을 쉽게 볼 수있는 방법이 없습니다.


아주 편리합니다. 몰랐습니다. .doc 파일에 대해 동일한 작업을 수행 할 수 없다는 수치는 내 회사가 여전히 사용하고 있기 때문입니다. 설명 주셔서 감사합니다!
대장장이

1
@Godsmith 최신 버전의 Word를 사용하여 DOC를 DOCX로 저장 한 다음 변경 한 내용이 있으면 DOC로 다시 돌아올 수 있습니다. 이 프로세스에는 형식 손실이 있으므로주의해야하지만 DOCX에서 수행하여 DOC 유형을 변경하거나 문제를 해결할 수 있습니다.
ThisClark

MS Word에서 모든 파일을 html로 직접 저장할 수도 있습니다. 또는 RTF로 저장하고 RTF 파일을 텍스트로 열 수 있습니다
phuclv

3

.doc 형식이 매우 어렵다고 생각하므로 여기서 도와 드릴 수 없습니다. 그러나 .docx는 실제로 모든 세부 정보가 XML 파일에 저장된 zip 파일입니다. 따라서 파일 이름을 .zip으로 바꾸고 소스를 살펴보십시오!


0

* .doc와 같은 이진 형식에 관해서는 상황이 더 까다 롭습니다. LibreOffice의 mso-dumper를 사용할 수 있습니다 . 로컬 시스템에 솔루션을 복제하고 실행하십시오.

python doc-dump.py \path\to\file.doc >output.xml

이제 이진 파일의 모든 내용이 Word (.doc) 이진 파일 형식에 설명 된 정확한 형식으로 xml로 변환됩니다.

간단하지만 mso-dumper만큼 강력하지 않은 WordFileDump 도 있습니다.

불행히도 그것들은 구조를 분석하기위한 것이며 XML 출력을 * .doc 파일로 다시 어셈블 할 수있는 도구가 없으므로 근본 원인을 찾으면 Word를 사용하여 편집해야합니다. 따라서 * .docx로 변환하는 것이 더 쉬울 것입니다. * .docx 파일을 검사 한 다음 필요한 경우 * .doc로 다시 변환하십시오.

또는 파일을 office xml 대신 "사람이 읽을 수있는"텍스트 파일 인 rtf 로 저장할 수도 있습니다 . 또는 단어 파일을 html로 저장하십시오

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.