DOC에 비해 DOCX 형식의 장점


9

오늘 나는 실수로 .docx가 동일한 .zip이라는 것을 알았습니다 (또는 그들 사이에 큰 차이는 없습니다). .docx를 .zip으로 변경하고 WinRAR로 열면 폴더에 많은 XML 파일이 표시됩니다. 해당 XML 파일에는 텍스트, 글꼴, 소유자, 마지막 수정 등이 저장됩니다. 한마디로 모든 정보는 XML 데이터로 저장됩니다.

그러나 .doc 확장자 파일에 대해서도 마찬가지입니다. .rar로 .zip op로 열 수 없습니다.

질문 : Microsoft가 데이터 저장 방식을 변경 한 .docx의 데이터를 XML로 저장하면 어떤 이점이 있습니까? 실제로 XML 형식의 장점이 아니라 Microsoft가 여러 XML 파일을 사용하여 .docx 데이터를 저장하는 이유를 알고 싶습니다. .docx는 루트에서 새로운 형식이 아닙니다.


1 분 안에 .. 5 거의 같은 답변. SO의 힘.
MRG

1
XML 형식의 데이터가 있다고해서 새로운 형식이 아니라는 의미는 아닙니다. 해당 XML을 OpenOffice에 공급하여 올바르게 렌더링 할 수 없습니다. XML 구조, 속성, 요소 등을 명확하게 정의해야합니다.

1
제목을보다 유익한 것으로 변경하십시오.
Carl Bergquist

2
물론 새로운 형식입니다. 어서

친애하는 Janis Veinbergs와 Kyle Rozendo에게 XML과 XSD를 많이 사용해 왔으며 어떻게 작동하는지 알고 있습니다 !!! 내가 "뿌리에서"라고주의하십시오. 새로운 형식이 아니라 방금 사용한 XML 형식이라는 것에 동의 할 수 없습니다!
Narek

답변:


12

.docx파일은 이미지 파일뿐 아니라 XML 파일과 같은 포함 된 리소스를 저장할 수 있습니다. base64 또는 다른 것으로 인코딩하고 XML 파일에 저장하거나 또 다른 이진 직렬화 형식을 발명하는 대신 표준 ZIP 형식을 사용하기로 결정했습니다.

그 외에도 XML은 많은 중복 패턴을 포함하는 매우 상세한 파일 형식입니다. XML 파일에 대해 높은 압축률을 얻을 수 있습니다.

그건 그렇고, 나는 실제로 "우리를 삼키는"부분을 얻지 못합니다. 새로운 암호화 파일 형식을 처음부터 새로 작성하거나 알려진 표준 형식을 사용하는 것이 더 낫습니까?


내가 볼 수있는 주요 이점은 실제로 이러한 파일을 만들기위한 Open API가 있다는 것이므로 독점 SDK에 많은 비용을 들이지 않고도 처음부터 .docx 파일을 만들 수 있습니다. Microsoft SDK는 C # 코드를 생성하여 미리 작성된 문서를 처음부터 생성하는 문서 리플렉터도 제공합니다.
Will Eddins

@ 가드 : 예. 내 답변은 질문의 원래 버전을 다룹니다. 그 이후로 질문은 크게 바뀌었다;) 원래 제목은 "Microsoft가 속임수?"
Mehrdad Afshari

xml 자체는 "알려진"형식을 만들지 않으며 .docx가 가장 좋은 예 중 하나입니다.
artistoex

5

위키 백과 문서가 꽤 멋지게 그것을 요약 :

"마이크로 소프트는 공개 파일 형식을 채택해야한다는 압력에 시달리고있다. 특히 몇몇 국가에서는 공식 문서가 공개 형식이어야한다는 규칙을 채택했다."

편집 : XML은 매우 장황하고 자연스럽게 압축이 잘되어 있기 때문에 압축하는 것이 좋습니다.


3
"열기"는 "압축 해제 가능"을 의미하지 않습니다.
Greg Hewgill

3
압축은 압축 외에도 다른 장점이 있습니다. 또한 여러 파일의 컨테이너 역할을합니다.
Joey

3

이름이 바뀐 .zip 파일을 사용하는 것이 일반적입니다. 예를 들어 Quake III .pak 파일은 실제로 .zip 파일입니다. 완벽하게 좋은 파일 형식이 이미 존재하는 경우 자체 압축 파일 형식을 발명 할 필요가 없습니다.


1
ZIP 아카이브 사용에 대한 추가 예제 : Java .jar, Winamp .wsz/ .wal(skins), Firefox .xpi(XPInstaller-테마, 애드온). ( tar아카이브도 인기가 있습니다.)
user1686

1

압축 된 XML을 사용하는 것은 Office Open XML만이 아닙니다. Open Office의 OpenDocument는 배후에서 동일하게 작동합니다.

Open Packaging ConventionsWikipedia 페이지 에는 다음과 같은 장점이 있습니다 .

우회

로고가 1,000 번 반복되는 카탈로그를 예로 들어 보겠습니다. 간접 메커니즘을 사용하여 로고를 변경하려는 경우 어디를 볼지 알기 때문에 검색을하지 않고도 하나의 파일에서 하나의 항목 만 변경하면됩니다. 이것은 유지 보수성을 실질적으로 증가시킵니다. 파일이 저장된 ZIP 디렉토리의 레이아웃을 변경하려면 파일을 가리킬 수있는 모든 요소를 ​​알 필요가 없기 때문에 사소한 문제가됩니다. 모두 하나의 위치에 있습니다.

청킹

문서를 작은 덩어리로 나누도록 권장합니다. 파일 손상의 영향을 줄이는 데 좋습니다. 예를 들어, 하나의 XML 파트에있는 모든 스타일 정보, 각각 별도의 워크 시트 또는 테이블이 고유 한 파트에 있습니다. 이를 통해 클라이언트의 액세스 속도가 빨라지고 객체 생성이 줄어들며 여러 프로세스가 동일한 문서에서보다 쉽게 ​​작업 할 수 있습니다.

청킹은 프로그래머에게도 도움이됩니다. 한 스타일 시트를 다른 스타일 시트로 바꾸면 XML 작업이 아닌 ZIP 파일 작업이됩니다. 또한 주제에 대한 모든 정보가 해당 청크에 있다고 가정하여 청크에 접근 할 수 있기 때문에 프로그래머가 이해해야하는 양이 줄어 듭니다. 외부 요소.

상대적인 간접

Open Packaging Conventions에서 참조하는 각 파일에는 간접 목록이있는 자체 _rels 파일이 있습니다. 따라서 경우에 따라 모든 관련 리소스와 함께 일부 정보를 쉽게 잘라 붙여 넣을 수 있으며 이름 범위를 지정하여 파일 간 이름 충돌 가능성을 제거 할 수 있습니다.


0

가장 큰 장점은 파일의 압축을 풀고 xml 파일에서 텍스트를 복사하여 데이터에 액세스 할 수 있다는 것입니다. 이 작업은 Word 2007 복사본이없는 경우에도 zip 유틸리티 및 텍스트 편집기를 사용하여 수행 할 수 있습니다.

이것이 이전 바이너리 형식보다 형식을 더 개방적으로 만드는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.