«unicode» 태그된 질문

유니 코드는 모든 쓰기 시스템, 기술 기호 및 구두점을 포함하는 서면 텍스트에 필요한 모든 문자를 설명하기위한 범용 문자 집합입니다.

8
다양한 언어 구현에 유니 코드 식별자 지원을 추가하는 요점은 무엇입니까?
개인적으로 혼란스러운 유니 코드 식별자로 가득 찬 코드를 읽는 것을 발견했습니다. 제 생각에는 코드가 쉽게 유지 관리되지 않습니다. 다양한 번역가들의 저자가 그러한 지원을 구현하는 데 필요한 모든 노력은 말할 것도 없습니다. 또한 다양한 언어 구현의 장점 (실제로 중요한)의 목록에서 유니 코드 식별자 지원의 부족 (또는 존재)을 지속적으로 알 수 있습니다. …
14 unicode 

2
유니 코드 문자열을위한 효율적인 Trie 구현
효율적인 String trie 구현을 찾고 있습니다. 주로 다음과 같은 코드를 찾았습니다. Java에서 참조 구현 (wikipedia 당) 나는 주로 두 가지 이유로 이러한 구현을 싫어합니다. 256 개의 ASCII 문자 만 지원합니다. 키릴 같은 것들을 다룰 필요가 있습니다. 그들은 매우 메모리 비효율적입니다. 각 노드에는 Java의 64 비트 시스템에서 4096 바이트 인 256 …
12 unicode  trie 

5
“문자셋”이 실제로 일반적으로“인코딩”을 의미하는 이유는 무엇입니까?
오랫동안 혼란 스러웠던 것은 너무 많은 소프트웨어가 "문자셋"과 "인코딩"이라는 용어를 동의어로 사용한다는 것입니다. 사람들이 유니 코드 "인코딩"을 언급 할 때, 유니 코드 문자를 ASCII 또는 UTF-8과 같은 바이트 시퀀스로 나타내는 규칙 집합을 의미합니다. 이것은 합리적이고 직관적 인 것 같습니다. 아이디어는 지정된 규칙 세트를 사용하여 해당 문자를 바이트로 "인코딩"하는 것입니다. 그 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.