zip 파일에서 중복의 실질적인 가치는 무엇입니까?


9

압축에서 중복은 어떻게 구현되며 이점은 무엇입니까?

조회 테이블을 두 번 저장하는 것과 같이 구성되어 단일 결함으로 인해 파일의 나머지 부분이 모두 무효화되지 않는다고 가정합니다. 사용 사례와 관련하여 파일을 CD에 저장했을 때 약간의 흠집이 생길 수 있습니까?

그러나 개인적으로 zip 파일에 중복성을 추가하여 이익을 얻지 못했으며 생략하는 경향이 있으므로 실제로 실제로 유용한 지 궁금합니다.


CD 는 자체 중복성을 사용하여 스크래치 등을 보상합니다.이를 8-4 변조라고합니다. 더 나은 사용 사례는 어떤 이유로 든 손상된 다운로드 일 것이라고 생각합니다.
slhck

답변:


1

나는 당신이 LZ 적응 알고리즘에 대해 이야기하고 있다고 생각합니다. zip 파일을 작성하는 과정에서 중복되는 것이 있기 때문에 중복성이라고하지 않습니다. 이 압축 방법이 작동하는 방식에서 용어가 나옵니다.

예를 들어 설명하겠습니다. 문구가 포함 된 문서가 있다고 가정 해 봅시다.

It is what it is because that's what it is

중복성을 통해이 문구를 더 짧게 만들려면 먼저 반복 된 모든 단어를 포함하는 사전을 작성합니다.

1it
2is
3what

그런 다음 문장을 다음과 같이 다시 쓰겠습니다.

12312becausethats312 

그런 다음 압축을 더 원하면 사전에 다음을 추가 할 수 있습니다.

312x
12y

그것이되도록

yxbecausethatsx

보시다시피 중복 검사가 많을수록 압축률이 높아집니다. 그러나 또한 부패 가능성이 높아지고 있습니다. 사전이 커질수록 손상되기 쉬우 며 사전의 일부가 손상되면 나머지 부분을 읽을 수 없습니다.


2
나는 이것이 내가 의도 한 것이 아니라고 생각합니다. 복구 정보를 추가하는 옵션에 대해 이야기했습니다. 이 기능은 클래식 zip 형식으로 존재하지 않을 수 있습니다.
mafu

2
다른 질문에 대한 좋은 답변 : /
endolith
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.