파일을 압축하면 파일이 손상 될 수 있습니까?


85

방금 누군가에게 압축 psd파일 을 보내달라고 요청했습니다 .

파일압축하면 글꼴이 깨질 수 있다고 말하면서 거절했습니다 .

파일 압축은 완벽하게 되돌릴 수 있다고 가정하므로 일반적으로 사용되는 이유는 무엇입니까? 다른 사람이 틀렸다고 생각합니다.

파일 내용을 압축하는 압축에 대한 진실이 있습니까?


51
다른 사람이 파일 압축 (손실 없음)을 jpeg 압축 (손실)과 혼동하여 테스트가보기 흉하게 보일 수 있습니다.
Matt H

파일 형식이 모든 플랫폼에서 사용되기 때문에 zip 파일에 대한 호환성 문제가 있음을 알고 있습니다.
jokoon

1
필자는 Winrar와 WinXP의 내장 기능이 모두 파일 (단일 zip 파일 로 수천 개)을 파기 한 특정 '병리학 적'사례를 경험했습니다 . 이것은 4-5 년 전 이었습니다. 당시 내가 찾은 유일한 해결책은 7-zip을 사용하는 것입니다. 내가 기억할 수 있듯이, 7-Zip조차도 다른 루틴에 의해 생성 된 파일의 압축을 성공적으로 풀지 못했습니다. 어쨌든 나는 프로덕션 시스템의 양쪽에 7-zip을 사용하기로 결정했습니다.
FumbleFingers

1
@ jokoon : 모든 플랫폼에서 사용되는 파일 형식 을 말하는 것이 유효한지 확실하지 않습니다 . zip 파일에는 여러 가지 내부 형식이 사용되며 압축을 풀 때 사용하는 다른 루틴에서 완벽하게 지원되지 않는 형식을 사용하여 하나의 패킹 루틴으로 아카이브를 작성할 수 있습니다.
FumbleFingers

@어설프게 다루다; 그러나 여전히 적절한 아카이버는 해시 변경 사항을 포착하고 작업이 실패한 것으로보고해야합니다. 깨진 파일을 그대로 두지 마십시오.
Phoshi

답변:


133

아니요, 파일을 압축하면 파일을 중단 할 수 없습니다. zip 파일이 손상되지 않은 경우 압축 해제시 동일한 파일을 재생성합니다.

이 경우 서로 다른 두 시스템에 설치된 글꼴의 차이로 인해 문제가 발생할 수 있지만 zip / unzip 프로세스와는 전혀 관련이 없습니다.


4
그것이 내가 의심 한 것입니다. 답변 주셔서 감사합니다.
alex

34
또한 일부 zip 형식은 중복성을 지원 하므로 일반 파일을 저장하는 것보다 zip으로 저장하는 것이 실제로 더 안전 할 수 있습니다 .
BlueRaja-대니 Pflughoeft

당신은 이것을 빨리 말하지 않아야합니다. 많은 압축 / 압축 풀기 파일 구현이 있으며, 기존의 모든 OS와 zip 파일을 만들 수있는 다른 것들을 계산합니다. 일부 구현은 다른 것들을 신경 쓰지 않는다는 사실에 놀라지 않을 것입니다 .
jokoon

@jokoon : 그러면 해당 파일이 손상되어 명시 적으로 제외됩니다.
mbx

3
-1 이론적으로 이것은 사실이지만 실제로는 PC에서 Mac 글꼴이 0 바이트로 압축 해제되는 문제가 있습니다. 리소스 포크가 생성 되었기 때문입니다. 직접 시도해보십시오.
Django Reinhardt

80

에서 일반적으로 사용, 우편 무손실 (버그-freeimplementation 가정)이지만,이 하나의 데이터 손실에 적용 할 수있는 시나리오 : NTFS 대체 데이터 스트림은. 이 거의 사용되지 않는 기능을 통해 단일 파일 에 여러 개의 독립적 인 컨텐츠 세트가있을 수 있습니다. 대부분의 코드는 이름없는 스트림 만 볼 수 있지만 다른 코드는 존재할 수 있습니다.

그래서; 프로그램이 NTFS 대체 데이터 스트림에 데이터를 저장하기로 결정한 경우 zip 클라이언트 는 해당 부분을 볼 수 없습니다 (명시 적으로 요청해야하며 RAR이 현재이 작업을 수행하는 유일한 사람 임).

그러나 강조하기 위해 : 이것은 매우 드물게 사용되며 일반적으로 PSD와 같은 것은 아닙니다. 나는 당신의 친구 / 협회가 단순히 틀렸다고 생각합니다.


11
와, 이것은 나에게 완전히 새로운 지식이다.
kizzx2

5
나에게 새롭고 기괴한. 파일은 언제 파일이 아닙니까? 내용이 마음대로 변경 될 때 잘못된 기능에 대해 들었지만 많이는 아닙니다.
msw

7
@msw-마음대로 변경하지 않습니다. 간단히 말해서-단일 파일 레코드와 연관된 데이터가 두 개 이상있을 수 있습니다. 거의 항상 정확히 하나만 사용됩니다 (매우 드물게 사용됨).
Marc Gravell

4
SO로 돌아갑니다! 너무 기술적 인! (물론 농담;)
바이런 휘트 락


32

압축 한 후 압축을 해제하면 Mac 글꼴이 동일하지 않을 수 있습니다. 이로 인해 중단되지는 않지만 위의 일부 설명과 달리 프로세스가 동일한 파일을 제공하지 않을 수 있습니다.

상황은 여기에서 논의됩니다.

http://xahlee.org/UnixResource_dir/macosx.html

http://ask.metafilter.com/59789/How-to-email-my-font

그러나 간단히 말하면 :

  1. 리소스 포크가 포함 된 훨씬 오래된 글꼴이고 사용자에게 Mac OS X의 이전 버전 (일반적으로 10.4 이하)이있는 경우. 이와 같은 레거시 글꼴은 원래 OS 9 및 이전 버전의 Macintosh 운영 체제 용으로 설계되었지만 OS X에서 작동합니다. 일부 사람들은 20 년 전까지 오래 동안 구축 한 글꼴 라이브러리를 여전히 사용하고 있습니다. 일반적으로 이들은 아티스트 및 아트 디렉터 유형입니다. 예를 들어, 생성 날짜가 1993 인 글꼴이 몇 개 있고 생성 날짜가 1998 인 글꼴이 가장 많으며 대부분 리소스 포크가 있습니다. 확실히 나는 이것을 더 현대적인 형식으로 변환하거나 사용을 중단해야하지만, 직면 해 봅시다. Adobe Font Library를 구입하면 다시는 구입하고 싶지 않습니다. 광고 분야에서 아트 디렉터와 함께 일하면서

  2. 일부 메타 데이터는 특정 버전의 운영 체제에서 제거됩니다. 메타 데이터는 파일의 정보 필드에 추가 된 것일 수 있습니다. 이렇게하면 파일이 손상되지 않고 왕복 zip-unzip이 동일한 파일을 생성하지 않습니다.

추신 : 나는 다른 사람에게 배달하기 위해 PSD 파일을 압축하는 경우, 평평하지 않았고 글꼴이 윤곽선으로 변환되지 않았다고 가정합니다. 수신 측의 사람이 파일을 직접 변경할 수 있습니다. 이것은 일반적인 관행입니다.


2
+1-이 점을 스택 맨 위로 밀기에 충분한 포인트를 줄 수 있기를 바랍니다. Mac OS에는 글꼴 데이터가 리소스 포크에 저장되는 Type 1 및 TrueType 글꼴 변형이 있습니다. OS의 기본 zip / unzip 도구는 이러한 상황을 정상적으로 처리 할 수 ​​있지만 모든 도구 (특히 OS X로 이식 된 명령 줄 도구)는 아닙니다. 더 나쁜 것은 글꼴을 압축 하지 않고 전자 메일이나 FTP를 통해 보내려고하면 글꼴 손상됩니다!
afrazier

1
그러나 여기서 문제는 압축 여부에 관계없이 압축 방법에 관한 것으로 보입니다. 리소스 포크를 이해하는 프로그램이 필요하며 사용 방법을 알아야합니다. 내가 올바르게 읽고 있습니까?
uSlackr

@ uSlackr, 맞습니다.하지만 문제는 수신 측에서 지속됩니다. 아카이브가 Windows로 이동되면 Windows (특히 NTFS)가 파일에서 여러 데이터 스트림을 허용하지만 Windows의 글꼴은 그런 식으로 작동하지 않기 때문에 쓸모없는 글꼴 파일이 쌓일 수 있습니다. 그러나 PSD 파일 자체는 Mac과 Windows간에 이식 될 수 있습니다.
RBerteig

+1-예를 들어, Mac 글꼴을 네트워크 드라이브에 저장 한 다음 Windows 또는 Linux PC에서 크기가 0 바이트 인 것을 확인하십시오! 그것은 '그냥 작동합니다'라는 생각을 혼란스럽게 만드는 리소스 포크입니다.
ʍǝɥʇɐɯ

예, 업계에서 Mac 글꼴이 제대로 압축되지 않는다는 것은 잘 알려진 사실입니다. 종종 PC 사용자는 0 바이트를 압축 해제합니다.
Django Reinhardt

14

ZIP은 체크섬을 사용하여 압축 해제 된 파일이 압축 전과 정확히 같은지 확인합니다.

따라서 어떤 이유로 든 변경 된 경우 (예 : 깨진 아카이브)-포장을 풀지조차 않습니다.


zip이 무손실 압축을 사용하므로 관련이 없습니다 (또는 '스토리지', 압축을 비활성화 할 수 있음). 체크섬은 문제가 발생한 경우에만 피드백을 제공 할 수있는 것입니다.
akira

13
pedantry를 용서하지만 ZIP은 체크섬을 사용하지 않습니다 . 훨씬 광범위한 오류를 감지하는 32 비트 순환 중복 검사 (일명 CRC-32 )를 사용합니다.
Bevan

5
"체크섬"이라는 용어는 사람들이 암호화 해시 함수 의 결과를 "체크섬" 이라고 할 수 있다면 원래 정의보다 의미가 다소 넓어졌습니다 .
Random832

9

텍스트 모드 변환과 같은 어리석은 일을하거나 임베드 된 zip에 의해 혼동되는 어딘가에 zip / unzip이있는 경우에만 가능합니다. ( 과거에 몇 가지 버그 발생했습니다. 10 년 전의 의미 일 수 있습니다.)


4

Zip은 손실없는 압축 알고리즘을 사용하여 다시 얻는 데이터가 입력 한 데이터와 동일한 지 확인합니다.

(BTW, jpg, mpeg, mp3와 같은 다른 기술은 손실 기술을 사용하여 눈과 귀가 그렇게 민감하지 않다는 이론으로 압축합니다)


0

"Ziping breaks fonts"문에서 볼 수있는 유일한 진실은 PSD 파일 형식 자체에 "압축 된"버전 또는 옵션이있어 어떤 프로그램에서든 이러한 파일을 생성 할 수 있고이 옵션으로 인해 글꼴이 다르게 처리되는 경우입니다.

버그가있는 경우를 제외하고는 zip 프로그램을 사용하는 것이 좋습니다.

Marc에 대한 응답으로, EXT 파일 시스템에 잠재적 인 파일 시스템 문제가 있습니다. .zip이 있습니다). 또한 상대 경로로 소프트 링크를 압축 한 다음 다른 곳에서 압축을 풀면 물론 작동하지 않지만 zip 프로그램의 결함은 아닙니다.


0

이전에 PSD 문제를 해결하는 데 문제가 있었으면 압축기 소프트웨어에 결함이 있거나 PSD에 필요한 모든 파일이 포함되어 있지 않거나 컴퓨터가 바이러스에 감염된 것입니다.

파일을 USB 디스크로 이동하여 마지막 옵션을 버림으로써 비슷한 손상을 입 었는지 물어볼 것입니다.


0

완전성을 위해 한 가지주의 사항을 추가하기 만하면됩니다. 압축하면 권한 또는 마지막 액세스 시간과 같은 파일의 메타 데이터가 손실 될 수 있습니다.

나는 그것이 일반적으로 PSD 파일 및 글꼴과 관련이 있다고 생각하지 않습니다.


무손실 압축 알고리즘과이 작업을 수행하는 프로그램의 개념에 대한 오해가 있다고 생각합니다. 무손실을 의미합니다. 압축 된 이진 스트림은 동일한 출력 이진 스트림으로 압축 해제됩니다. 메타 정보는 OS에 따라 다르며 OS 및 / 또는 응용 프로그램에서 처리해야합니다.
보라

1
감사합니다, @Bora, 나는 그런 오해가 없습니다. 압축은 파일의 실제 데이터에 영향을 미치지 않습니다. 나는 지퍼가 파일과 디렉토리를 손상 시켰다고 생각하는 사람들을 속일 수있는 "외부"원인을 제안하고있다. 압축 된 백업을 복원하여 과거에는 응용 프로그램이 내가 가져 오지 않은 메타 데이터에 의존하기 때문에 더 이상 작동하지 않는 것을 발견했습니다. (나의 기본적인 오해가 아니라 단지 감독)
Oddthinking

0

Zip은 파일 이름을 손상시킬 수 있습니다. Zip은 유니 코드를 사용하지 않습니다. 파일 이름 인코딩은 지정되지 않았으며 Windows에서는 현재 로캘이 사용됩니다.

따라서 다른 시스템으로 전송하면 파일 이름이 엉망이됩니다.

가장 최근의 프로그램 (버전 11 이후의 winzip)이 사용하는 Zip 형식의 확장이 있습니다.

나는 압축을 풀 수없는 일본 이름으로 가득 찬 지퍼가 있었으므로 7z everevercece를 선호합니다.


0

zip 파일은 내용을 정확하게 재현 할 수 있어야합니다.

하나의 관련 참고 사항- 데이터가 원래 형식 인 경우보다 zip 파일이 손상된 경우 데이터 를 복구 하기가 더 어렵습니다 . 왜? 많은 파일 형식에는 중복성이 내장되어 있으며 사소한 오류를 수정하거나 사소한 오류가 중요하지 않도록 설계되었습니다.

비디오 파일을 상상해보십시오. 대부분의 형식에서 작은 부분이 손상되면 비디오의 작은 부분에 일시적으로 깜박임이 있지만 여전히 비디오를 볼 수 있습니다. 그러나 비디오 파일이 압축되면 오류 수정 기능이 저하되며 손상 정도에 따라 파일의 압축을 풀지 못하거나 비디오를 볼 수 없습니다. (어쨌든 대부분의 비디오 형식을 압축하는 데 쓸모가 없기 때문에 이것은 예의입니다).

이는 모든 압축 형식에 해당합니다. 정의에 의한 압축은 중복성을 줄이고 따라서 오류 수정 기능과 그 절충점을 줄입니다.


위에서 언급했듯이 일부 zip 파일 형식은 중복성을 지원합니다. 이렇게하면 원래 형식보다 더 안전하게 만들 수 있습니다.
DMan
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.