Wikipedia 에 따르면 :
Shannon의 엔트로피는 결정된 (또는 예측 가능한) 메시지 부분과 반대로 메시지에 포함 된 정보를 측정합니다. 후자의 예는 언어 구조의 중복성 또는 문자 또는 단어 쌍의 발생 빈도, 삼중 항 등과 관련된 통계적 속성을 포함합니다.
엔트로피는 메시지에 포함 된 정보의 양을 측정 한 것입니다. 엔트로피 코더는 그러한 메시지를이를 나타내는 데 필요한 최소 비트 수 (엔트로피)로 무손실 압축하는 데 사용됩니다. 나에게 이것은 완벽한 엔트로피 인코더처럼 보입니다. 가능한 한 손실없이 메시지를 압축하는 데 필요한 모든 것입니다.
그러나 많은 압축 알고리즘은 엔트로피 코딩 전에 단계를 사용하여 메시지의 엔트로피를 감소시킵니다.
독일 위키 백과 에 따르면
Entropiekodierer 님이 anderen Kodierern kombiniert을 (를) 방문했습니다. Dabei dienen vorgeschaltete Verfahren dazu 님이 Entropie der Daten zu verringern에 있습니다.
영어로:
엔트로피 코더는 종종 다른 엔코더와 결합됩니다. 이전 단계는 데이터의 엔트로피를 줄이는 역할을합니다.
즉, bzip2는 엔트로피 코딩 (이 경우 허프만 코딩)을 적용하기 전에 Burrows-Wheeler-Transform 다음에 Move-To-Front-Transform을 사용합니다.
이 단계는 메시지의 엔트로피를 실제로 줄여서 메시지에 포함 된 정보의 양을 줄입니까? 압축 중에 정보가 손실되어 무손실 압축 해제를 방지한다는 의미이므로 모순되는 것처럼 보입니다. 아니면 단순히 엔트로피 코딩 알고리즘의 효율성을 향상시키기 위해 메시지를 변환합니까? 아니면 엔트로피가 메시지의 정보량과 직접적으로 일치하지 않습니까?