«unicode» 태그된 질문

유니 코드는 모든 쓰기 시스템, 기술 기호 및 구두점을 포함하는 서면 텍스트에 필요한 모든 문자를 설명하기위한 범용 문자 집합입니다.

20
UTF-16을 유해한 것으로 간주해야합니까?
아마도 논란의 여지가있는 질문이 무엇인지 물어볼 것입니다. "가장 인기있는 인코딩 중 하나 인 UTF-16이 유해한 것으로 간주되어야합니까?" 왜이 질문을합니까? UTF-16이 실제로 가변 길이 인코딩이라는 사실을 알고있는 프로그래머는 몇 명입니까? 이것은 대리 쌍으로 표현되는 코드 포인트가 두 개 이상의 요소를 취하는 것을 의미합니다. 알아; 많은 애플리케이션, 프레임 워크 및 API는 Java의 …
432 unicode 

5
UTF-8이 수백만 개의 새로운 문자로 방대한 외계 언어를 포함하도록 지원할 수 있습니까?
경우에 외계인의 침공은 문자의 자신의 가능성 방대한 양의 수 있도록하는 방법으로 UTF-8을 설계, 발생 그리고 우리는 우리의 기존 컴퓨터 시스템의 모든 자신의 언어를 지원하기 위해 강제로? (물론, 우리는 외계인이 실제로 언어를 가지고 있는지, 의사 소통을하는지 또는 어떻게 말하는지 알지 못하지만, 논쟁을 위해, 단지 그들이한다고 상상해보십시오.) 예를 들어, 언어가 수백만 개의 …
86 unicode  utf-8 

15
변수 이름에 유니 코드 문자를 사용하는 것이 좋지 않습니까? [닫은]
최근에 Python 3에 순위 알고리즘 AllegSkill을 구현하려고했습니다. 수학은 다음과 같습니다. 아뇨 이것은 내가 쓴 것입니다 : t = (µw-µl)/c # those are used in e = ε/c # multiple places. σw_new = (σw**2 * (1 - (σw**2)/(c**2)*Wwin(t, e)) + γ**2)**.5 실제로 파이썬 3가 변수 이름을 받아들이지 √않거나 ²변수 이름으로 사용 …
82 naming  unicode 

8
유니 코드 인코딩이 여러 개인 이유는 무엇입니까?
나는 유니 코드가 대부분의 이전 시도 (ASCII 등)에서 작은 주소 공간 (8 비트)으로 인해 많은 다른 인코딩을 갖는 전체 문제를 해결하도록 설계되었다고 생각했습니다. 그렇다면 왜 그렇게 많은 유니 코드 인코딩이 있습니까? UTF-8, UTF-16 등과 같은 (본질적으로) 동일한 버전의 여러 버전조차도.

2
UTF-8 CSV 파일에 BOM (바이트 순서 표시)이 포함되어야합니까?
업무용 소프트웨어를 사용하면 특정 데이터를 CSV 로 저장할 수 있습니다 . 야생에서 사용되는 다양한 형식 (모두 "CSV")이 많으므로 "기본 형식"의 모양을 결정하려고합니다. 라인 / 필드 구분 기호 및 이스케이프와 관련하여 사용할 수있는 표준이 있습니다. RFC 4180 . 텍스트 인코딩과 관련하여 UTF-8 은 "기본 텍스트 파일 형식"으로 지난 10 년 동안 …

2
유니 코드 라이센스
유니 코드 사용 약관은 데이터 파일을 사용하는 모든 소프트웨어 (또는 그 수정)가 유니 코드 라이센스 참조를 포함해야한다고 명시하고 있습니다. 대부분의 유니 코드 라이브러리에는 문자가 숫자, 문자, 기호 등인지 확인하는 기능이 있으므로 유니 코드 데이터 파일 (일반적으로 테이블 형식)의 수정 사항이 포함됩니다. 이는 라이센스가 적용되고 해당 유니 코드 라이브러리를 사용하는 모든 …

3
왜 Microsoft SQL Server에서 문자열 앞에 N을 넣어야합니까?
T-SQL을 배우고 있습니다. 내가 본 예제에서 varchar()셀에 텍스트를 삽입하기 위해 삽입 할 문자열 만 쓸 수 있지만 nvarchar()셀의 경우 모든 예제에는 문자열 앞에 문자 N이 붙습니다. nvarchar()행 이있는 테이블에서 다음 쿼리를 시도했지만 제대로 작동하므로 접두사 N이 필요하지 않습니다. insert into [TableName] values ('Hello', 'World') 내가 본 모든 예제에서 문자열 앞에 …

8
UTF-8 이외의 문자 인코딩 (및 UTF-16 / UTF-32)은 더 이상 사용되지 않습니까?
내 애완 동물은 문자 세트 지원을위한 코드가 많은 소프트웨어 프로젝트를보고 있습니다. 내가 틀리지 말고, 나는 호환성을 위해 모두 노력하고 있으며, 텍스트 편집기를 사용하여 파일을 여러 문자 세트로 열고 저장할 수있어서 기쁩니다 . 나를 괴롭히는 것은 비 유니버설 문자 인코딩의 확산이“문제”가 아닌“적절한 유니 코드 지원”으로 분류되는 방법입니다. 예를 들어 PostgreSQL과 해당 …


5
사람들이 유니 코드가 아닌 일본어 전용 인코딩을 사용하게하는 문제는 무엇입니까?
직장에서 Shift-JIS 및 기타 인코딩으로 많은 일본어 텍스트 파일을 발견했습니다. 모든 컴퓨터 사용자에게 여러 가지 모모 베이크 (판독 불가 문자) 문제가 발생합니다. 유니 코드는 모든 언어에 대해 단일 문자 집합을 정의하여 이러한 종류의 문제를 해결하기위한 것이며 UTF-8 직렬화는 인터넷에서 사용하는 것이 좋습니다. 그렇다면 왜 모두가 일본어 전용 인코딩에서 UTF-8로 전환하지 …


4
PHP가 정확히 유니 코드를 완전히 지원할 수없는 이유는 무엇입니까?
PHP는 유니 코드에 문제가 있다는 것을 모두 알고 있습니다. 유니 코드 구현 문제로 인해 버전 6이 효과적으로 버려졌습니다. 그러나 정확한 이유 가 무엇인지 아는 사람이 있는지 궁금합니다 . 건축 / 디자인 문제, 성능 문제, 커뮤니티 문제 (내가 아닌), 다른 것?

3
모든 지역화 및 문자열 유형에 작동하는 일반화 된 문자열 반전 함수를 작성할 수 있습니까?
방금 Dev-Days 의 Jon Skeet (Tony the Pony) 프레젠테이션을 보고있었습니다 . "문자열 역전 함수 작성"이 인터뷰 101을 코딩하고 있지만 실제로 모든 지역화 및 모든 문자열 유형에서 작동하지 않는 일반적인 문자열 역기능을 작성할 수 있는지 확실하지 않습니다. 입력 문자열이 ASCII, UTF8, UTF16 (고정 및 가변 길이)인지 여부를 감지하는 것 외에도 Jon이 …

2
UTF-16은 고정 너비 또는 가변 너비입니까? UTF-8에 바이트 순서 문제가없는 이유는 무엇입니까?
UTF-16은 고정 너비 또는 가변 너비입니까? 다른 출처에서 다른 결과를 얻었습니다. 에서 http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16은 유니 코드 문자를 16 비트 청크로 저장합니다. 에서 http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16 비트 유니 코드 변환 형식)은 유니 코드 코드 공간에서 0에서 0x10FFFF까지 1,112,064 [1] 숫자 (코드 포인트)를 인코딩 할 수있는 유니 코드 용 문자 …

3
유니 코드 센티넬 값을 사용할 수 있습니까?
파일 형식을 원하고 있으며 올바르게하고 싶습니다. 이진 형식이므로 파일의 첫 번째 바이트 (또는 바이트)가 유효한 텍스트 문자를 구성 해서는 안됩니다 (PNG 파일 헤더 1에서와 동일 ). 이를 통해 형식을 인식하지 못하는 도구는 처음 몇 바이트를보고 여전히 텍스트 파일이 아님을 확인할 수 있습니다. 위의 모든 코드 포인트 0x7F는 유효하지 않은 US-ASCII이므로 …
14 unicode 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.