«utf-8» 태그된 질문

유니 코드의 문자 인코딩에 대한 질문입니다.

1
"utf8 = ✓"를 "utf8 = true"보다 선호합니까?
최근에 쿼리 매개 변수 "utf8 = ✓"를 포함하는 몇 개의 URI를 보았습니다. 나의 첫인상 ( "mmm, cool cool"이라고 생각한 후)은 이것이 깨진 문자 인코딩을 감지하는 데 사용될 수 있다는 것이었다. 문자 인코딩의 잠재적 인 문제를 해결하는 더 좋은 방법입니까, 아니면 개발자가 해킹을 즐기기 만합니까?

2
파일 인코딩을 감지하는 방법?
내 파일 시스템 (Windows 7)에 텍스트 파일이 있습니다 (중요한 경우 SQL 스크립트 파일입니다). Notepad ++로 열면 "인코딩"메뉴에서 일부는 "UCS-2 Little Endian"으로 인코딩되고 일부는 "UTF-8없는 BOM"으로 인코딩됩니다. 차이점은 무엇입니까? 그것들은 모두 완벽하게 유효한 스크립트 인 것 같습니다. 메모장 ++없이 파일에 어떤 인코딩이 있는지 어떻게 알 수 있습니까?

5
UTF-8보다 ASCII 인코딩을 선택하면 어떤 이점이 있습니까?
ASCII의 모든 문자는 스토리지를 늘리지 않고도 UTF-8을 사용하여 인코딩 할 수 있습니다 (둘 다 스토리지 바이트 필요). UTF-8은 "ASCII-characters"이외의 문자 지원 이점을 제공합니다. 그런 경우에는, 우리는 왜 것 이제까지 UTF-8을 통해 ASCII 인코딩을 선택 하는가? UTF-8 대신 ASCII를 선택할 때 유스 케이스가 있습니까?

5
UTF-8이 수백만 개의 새로운 문자로 방대한 외계 언어를 포함하도록 지원할 수 있습니까?
경우에 외계인의 침공은 문자의 자신의 가능성 방대한 양의 수 있도록하는 방법으로 UTF-8을 설계, 발생 그리고 우리는 우리의 기존 컴퓨터 시스템의 모든 자신의 언어를 지원하기 위해 강제로? (물론, 우리는 외계인이 실제로 언어를 가지고 있는지, 의사 소통을하는지 또는 어떻게 말하는지 알지 못하지만, 논쟁을 위해, 단지 그들이한다고 상상해보십시오.) 예를 들어, 언어가 수백만 개의 …
86 unicode  utf-8 

6
데이터베이스 구성에서 Latin-1을 UTF-8보다 사용해야합니까?
우리는 내가 일하는 회사에서 MySQL을 사용하고 있으며 Ruby on Rails를 사용하여 클라이언트와 내부 애플리케이션을 모두 구축합니다. 여기서 일을 시작했을 때, 나는 전에는 결코 겪어 보지 못한 문제에 부딪쳤다. 프로덕션 서버의 데이터베이스는 Latin-1로 설정됩니다. 즉, 사용자가 UTF-8 문자를 복사하여 붙여 넣는 사용자 입력이있을 때마다 MySQL gem에서 예외가 발생합니다. 상사는이 "나쁜 캐릭터"라고 …

8
UTF-8 이외의 문자 인코딩 (및 UTF-16 / UTF-32)은 더 이상 사용되지 않습니까?
내 애완 동물은 문자 세트 지원을위한 코드가 많은 소프트웨어 프로젝트를보고 있습니다. 내가 틀리지 말고, 나는 호환성을 위해 모두 노력하고 있으며, 텍스트 편집기를 사용하여 파일을 여러 문자 세트로 열고 저장할 수있어서 기쁩니다 . 나를 괴롭히는 것은 비 유니버설 문자 인코딩의 확산이“문제”가 아닌“적절한 유니 코드 지원”으로 분류되는 방법입니다. 예를 들어 PostgreSQL과 해당 …


2
UTF-16은 고정 너비 또는 가변 너비입니까? UTF-8에 바이트 순서 문제가없는 이유는 무엇입니까?
UTF-16은 고정 너비 또는 가변 너비입니까? 다른 출처에서 다른 결과를 얻었습니다. 에서 http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16은 유니 코드 문자를 16 비트 청크로 저장합니다. 에서 http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16 비트 유니 코드 변환 형식)은 유니 코드 코드 공간에서 0에서 0x10FFFF까지 1,112,064 [1] 숫자 (코드 포인트)를 인코딩 할 수있는 유니 코드 용 문자 …

3
소스 코드가 UTF-8이어야합니까?
나는 종종 코드의 형식을 실제로 선택하지 않는다고 생각합니다. 과거의 대부분의 도구가 나를 위해 결정했습니다. 또는 나는 그것에 대해 생각조차하지 않았습니다. 나는 다른 날에 Windows에서 TextPad를 사용하고 있었고 파일을 저장할 때 ASCII, UTF-8 / 16, Unicode 등을 묻습니다. 작성된 거의 모든 코드가 ASCII라고 가정하지만 왜 ASCII 여야합니까? 실제로 소스 코드에 UTF-8 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.