평문은 이진입니다.
H
하드 드라이브에 쓰기를 할 때 쓰기 헤드는 두 개의 세로선과 가로선을 플래터에 새기지 않으며 비트 01001000
1 을 플래터에 자기 적으로 인코딩합니다 .
거기에서 일반 텍스트 데이터를 저장하는 것은 이진 데이터를 저장하는 것과 정확히 동일한 공간을 차지합니다.
그러나 평문은 하나의 두 가지 특정 이진 형식 일뿐 입니다.
평문은 다른 이진 형식으로 가역적으로 변환 될 수 있습니다. 일반적인 변환 중 하나는 압축으로, 일반적으로 같은 정보를 나타내는 데 사용되는 비트 수가 적다는보다 컴팩트 한 표현이 가능합니다.
일반 텍스트를 사용하여 나타내는 것에 따라 다른 이진 형식을 사용하여 동일한 정보를 나타낼 수 있습니다. 더 많은 공간을 사용할 수 있고 더 적은 공간을 사용할 수 있습니다.
예를 들어, 숫자 5
와는 1234567
디스크에 이러한 비트 시퀀스의 결과로, 숫자 문자를 사용하여 일반 텍스트로 표현 될 수 3 :
00110101 00000000
00110001 00110010 00110011 00110100 00110101 00110110 00110111 00000000
또는 32 비트 2의 보수를 사용할 수 있습니다 .
00000000 00000000 00000000 00000101
00000000 00010010 11010110 10000111
이것은 덜 간결한 표현 5
이지만보다 간결한 표현입니다 1234567
.
그리고 실제로는 많은 표현이 실제로 사용되는 것보다 훨씬 적지 만 다양한 수준의 압축성 및 유연성을 갖는 문자 그대로 무한한 수의 다른 표현이 있습니다.
1 UTF-8 가정. 문자의 정확한 비트 순서는 사용중인 특정 인코딩에 따라 다릅니다.
2 또는 다양한 인코딩을 고려할 때 실제로 몇 가지 형식이 있습니다 .
3 끝의 8 개의 0이 무엇인지 궁금하다면 데이터의 길이를 아는 방법이 필요합니다. 옵션은 기본적으로 마커 (널 바이트를 통해 이것을 사용했습니다), 길이를 저장하는 전용 공간 (파스칼은 바이트를 문자열의 길이를 저장하는 데 사용했습니다) 또는 고정 크기 (다음 2의 보수에 사용됨) 예).