먼저 약간의 설명 : 옥텟 (8 비트 단위)은 실제로 현대 컴퓨터 아키텍처 의 기본 단위 가 아닙니다 . 2, 2, 4, 16, 32, 64, 128 등의 다른 제곱보다 적어도 기본은 아닙니다. 옥텟은 8 비트 프로세서 (따라서 이름!)의 기본 단위 였지만 현대 아키텍처는 일반적으로 더 큰 비트로 작동합니다 내부적으로 설정합니다. 예를 들어 x86_64에는 64 비트 정수 레지스터와 80 비트 부동 소수점 레지스터가 있습니다. RAM은 64 비트 청크로 읽히고 쓰여지며, 프로세서는 약간의 마술을 사용하여 개별 8 비트 바이트를 처리 할 수있는 것처럼 보입니다.
이전 아키텍처의 경우 "바이트"는 데이터 버스의 크기를 나타내 었으며 원래 질문으로 여러 가지 버스 크기가 존재했습니다 (4, 5, 6, 8, 12 등). 그러나 1993 년 이래로 데이터 크기에 대한 표준화 된 SI 단위를 갖기 위해 바이트는 8 비트로 정의 되었습니다 . 따라서 "바이트"의 의미는 아키텍처 종속 단위에서 아키텍처 독립적 표준화 단위로 변경되었습니다.
요즘 바이트는 데이터를 주소 지정하고 정량화하기위한 표준 단위이지만 실제로는 기본이 아닙니다.
옥텟 단위는 주로 텍스트 저장에 대한 우려로 인해 저장에 대한 사실상의 표준이되었습니다. 텍스트를 저장하기 위해서는 1 바이트를 문자로 저장하는 것이 이상적입니다. 두 가지 요소가 중요했습니다.
- 디지털 시스템을 설계 할 때 2의 거듭 제곱 (2, 4, 8, 16, 32 등)을 갖는 것이 더 편리합니다.
- 8 비트는 ASCII 문자 세트에 단일 문자를 저장하기에 충분합니다 (키릴 문자를 지원하도록 문자 세트를 확장하기위한 여유 공간이 있음).
물론 8 비트는 모든 스크립트를 지원하기에 충분하지 않습니다. 일본어와 같은 것에는 최소한 16 비트가 필요하지만 가치가있는 것은 유니 코드는 21 비트입니다. 그러나 그 시점에서 비트는 비싸고 대부분의 디지털 텍스트는 어쨌든 ASCII 범위.
요즘 텍스트는 일반적으로 UTF-8과 같은 가변 너비 인코딩에 저장되며 유니 코드와 같은 문자 결합을 통해 "1 바이트는 한 문자와 같습니다"는 과거의 일이었습니다. 오늘날 바이트는 실제로 역사적인 이유로 표준입니다.