Open XML SDK 2.0을 잡고 "Microsoft Office 용 Open XML 생산성 도구"를 실행하십시오. 이것은 .xlsx 또는 .docx 내에서 XML 데이터에 대해 여러 가지 분석을 수행 할 수있는 깔끔한 응용 프로그램이며, 비교 도구를 사용하여 XML에서 두 문서의 내용을 비교하여 bloat의 위치를 쉽게 확인할 수 있어야합니다. 수평.
몇 가지 가능성이 있습니다.
- LibreOffice은 Office가 "암시 적"으로 취급하거나 "일반"템플릿에 포함 된 추가 데이터 (글꼴 / 셀 스타일, 서식 정보 등)를 삽입 할 수 있습니다.
- LibreOffice에서 데이터를 압축하지 않을 수 있습니다. 모르는 경우 Office는 무손실 압축 (ZIP와 유사)을 사용하여 모든 데이터를 Open XML 형식으로 압축합니다. 나는 LibreOffice가 그것을 지원해야한다고 생각했지만 개인이 실행중인 버전의 압축에 문제가있을 수 있습니다. 비교 도구를 실행할 때 데이터에 큰 차이가없는 경우 가장 가능성이 높은 상황입니다.
- LibreOffice은 (는) 데이터를 다시 구문 분석하고, 자체 내부 구조를 만들고, 문서 자체의 내부 표현에 가장 적합한 방식으로 데이터를 별도의 루틴을 사용하여 저장하여 Office보다 효율적이지 않을 수 있습니다. 이것은 사실이라면 LibreOffice의 기본 기능과 Office의 기능에 사용 된 기능과 기술의 근본적인 차이를 나타내는 디자인 문제 일뿐입니다.
다음과 같이 두 번째 가능성 (압축 문제)을 쉽게 배제 할 수 있습니다.
- ~ 220K Office 버전을 가져 와서 LibreOffice에서 열고 단일 문자를 단일 셀에 추가 한 후 저장하십시오.
- 7-Zip이 없으면 설치 하십시오.
- LibreOffice에서 저장 한 .xlsx 및 Excel에서 저장 한 .xlsx를 7-zip으로 엽니 다.
- 아카이브의 디렉토리 계층을 탐색하여 파일이 아닌 디렉토리를 찾으십시오 .
- "크기"와 "포장 크기"를 비교하십시오. 상기 중간 크기 LibreOffice와의 저장의 훨씬 더 큰, 다음 LibreOffice와는 데이터 자체를 팽만감된다. 경우 크기는 거의 동일하지만, 팩형 크기가 크기보다 훨씬 작은 아니라, 다음 압축 사용, 또는 나쁜 압축되지 않습니다. 내 PC에서 Microsoft Excel 2010은 _rels.rels 파일을 588 바이트에서 245로, xl \ styles.xml 파일을 3037 바이트에서 878로 압축합니다.
다음과 같이 첫 번째 글 머리 기호를 쉽게 배제 할 수 있습니다.
- ~ 220K Office 버전을 가져 와서 LibreOffice에서 열고 단일 문자를 단일 셀에 추가 한 후 저장하십시오.
- 생산성 도구를 실행하고 XML을 비교하십시오.
- 단일 문자 변경이 이루어진 매우 작고 포함 된 영역을 제외하고 문서가 사실상 동일한 경우 첫 번째 문제 (추가 데이터 삽입)가 적용되지 않을 수 있습니다.
첫 번째와 두 번째 문제를 모두 배제했다면, 남은 것을 볼 수있는 유일한 가능성은 세 번째 문제 일뿐입니다. 해결하기가 쉽지 않고 LibreOffice가 "단순히 비효율적"이라는 것을 의미 할 수 있습니다.
실제로 문제를 해결하려면 가장 먼저 최신 버전의 LibreOffice를 테스트해야합니다. 베타 / 릴리스 후보 / 사용 가능한 모든 것을 시도하십시오. Windows 또는 Linux와 같은 다른 플랫폼에서 사용해보십시오. 다른 것보다 더 효율적인 결과를 생성하는 버전 또는 플랫폼을 알아낼 수 있는지 확인하십시오. 일반적으로 최신 버전 (심지어 시험판 버전)도 이전 버전보다 문제에 대한 해결책을 포함 할 가능성이 높습니다.