내 애완 동물은 문자 세트 지원을위한 코드가 많은 소프트웨어 프로젝트를보고 있습니다. 내가 틀리지 말고, 나는 호환성을 위해 모두 노력하고 있으며, 텍스트 편집기를 사용하여 파일을 여러 문자 세트로 열고 저장할 수있어서 기쁩니다 . 나를 괴롭히는 것은 비 유니버설 문자 인코딩의 확산이“문제”가 아닌“적절한 유니 코드 지원”으로 분류되는 방법입니다.
예를 들어 PostgreSQL과 해당 문자 세트 지원을 선택하겠습니다 . PostgreSQL은 두 가지 유형의 인코딩을 처리합니다.
- 클라이언트 인코딩 : 클라이언트와 서버 간의 통신에 사용됩니다.
- 서버 인코딩 : 데이터베이스에 내부적으로 텍스트를 저장하는 데 사용됩니다.
많은 클라이언트 인코딩을 지원하는 것이 좋은 이유를 이해할 수 있습니다. UTF-8에서 작동하지 않는 클라이언트는 스스로 변환을 수행 할 필요없이 PostgreSQL과 통신 할 수 있습니다. 내가 얻지 못하는 것은 PostgreSQL이 여러 서버 인코딩을 지원하는 이유는 무엇입니까? 데이터베이스 파일은 하나의 PostgreSQL 버전에서 다음 PostgreSQL 버전으로 (거의 항상) 호환되지 않으므로 버전 간 호환성은 문제가되지 않습니다.
UTF-8은 모든 유니 코드 코드 포인트를 인코딩 할 수있는 유일한 ASCII 호환 표준 문자 세트입니다 (잘못되면 알려주세요). 나는 캠프에서 UTF-8이 최고의 문자 세트이지만 UTF-16 및 UTF-32와 같은 다른 범용 문자 세트를 기꺼이 사용하려고합니다.
유니버설이 아닌 모든 문자 세트는 더 이상 사용되지 않아야한다고 생각합니다. 그들이해서는 안되는 설득력있는 이유가 있습니까?