엔트로피는 랜덤 변수 의 특징입니다 . 주어진 파일은 일정하기 때문에 엔트로피가 없습니다. 엔트로피는 채널이없는 많은 상황에서 의미가 있으며 주어진 소스에서 생성 된 WAV 파일의 임의 앙상블에 적용 할 수 있습니다. 이 경우엑스는 IS 전체 WAV 파일.
실제 WAV 파일 (헤더 제외)은 일부 Markovian 소스에서 생성 된 것으로 생각할 수 있습니다. 이 소스는 순서대로 사운드 진폭 ( "샘플")을 생성합니다. 프로세스를 매우 오랫동안 실행 한 후에는 각 샘플의 엔트로피 (보다 정확하게는 이전 샘플에서 주어진 조건부 엔트로피)가 일부 제한 값에 매우 가까워 지므로 소스의 엔트로피로 정의됩니다. 엔트로피엔 샘플은 엔그 수를 곱한 것입니다 (한도에서 더 정확하게 말하면 조건부 엔트로피를 측정합니다). Lempel과 Ziv는 샘플 엔트로피가H 비트, 그들의 알고리즘 압축 엔 에 샘플 H엔+ o ( N)높은 확률로 비트 (확률은 샘플을 초과합니다). Lempel–Ziv 압축은 실제로 널리 사용되며 예를 들어 널리 사용되는 gzip
형식으로 사용됩니다.
이 Lempel 및 Ziv 결과로 인해 Lempel-Ziv 알고리즘을 사용하여 긴 샘플 시퀀스를 압축하여 소스의 엔트로피를 추정 할 수 있습니다. 이것은 잘 정의 된 개념이 아닌 특정 샘플의 엔트로피를 추정하지 않으며 (상수 시퀀스는 0 엔트로피를 가짐) 오히려이를 생성하는 소스의 엔트로피입니다.
관련 개념은 알고리즘 엔트로피 이며 Kolmogorov의 복잡성 이라고도 합니다. 파일을 생성하는 가장 짧은 프로그램의 길이입니다. 이 수량은 개별 파일에 적합합니다. 랜덤 소스에 의해 생성 된 파일의 경우, Lempel–Ziv 정리는 파일의 알고리즘 엔트로피가 Shannon 엔트로피에 의해 높은 확률로 제한됨을 보여줍니다. 불행히도 알고리즘 엔트로피는 계산할 수 없으므로 이론적 인 개념에 가깝습니다.
그림을 완성하기 위해 소스의 엔트로피를 추정하는 다른 방법으로 인쇄 된 영어의 예측 및 엔트로피에 관한 Shannon의 논문을 읽는 것이 좋습니다 .