비 압축 파일 추정이 잘못 되었습니까?


9

큰 (~ 60G) 압축 파일 ( tar.gz)이있었습니다.

나는 split그것을 4 부분 cat으로 나눈 다음 다시 결합했습니다.

그러나 이제 압축되지 않은 파일의 크기를 추정하려고 할 때 파일이 원본보다 작습니까? 이것이 어떻게 가능한지?

$ gzip -l myfile.tar.gz 
         compressed        uncompressed  ratio uncompressed_name
        60680003101          3985780736 -1422.4% myfile.tar

split이 정말 관련? 분할하고 다시 결합한 후에 만 ​​문제점이 있습니까?
Barmar

답변:


20

압축되지 않은 크기를 압축 된 파일로 저장하는 데 사용되는 필드 크기 때문에 발생합니다. 32 비트이므로 gzip최대 4GiB의 파일 크기 만 저장할 수 있습니다. 더 큰 것은 올바르게 압축 및 압축 해제되지만 gzip -l압축되지 않은 크기는 올바르지 않습니다.

따라서 tarball을 분리하고 재구성해도 파일이 영향을받지 않아야합니다. 파일을 확인하지 않으려면로 확인하십시오 gzip -tv.

참조 빠른 큰 gzip으로 압축 된 파일의 압축되지 않은 크기를 운동의 방법에 대한 자세한 내용 및 매뉴얼 :gzip

gzip포맷은 입력 크기의 모듈을 나타내는 2³² 압축되지 않은 크기 압축비 압축 파일 4 지브 큰 대해 잘못 나열된 있도록.


따라서 실제 콘텐츠는 그대로 유지 될 수 있습니다.
Ruslan

@Ruslan 예, 표시된 크기가 잘못되었지만 내용은 정상입니다.
Stephen Kitt

+1 UINT32 오류 또는 이와 유사한 것으로 추측되었습니다.
mathreadler
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.