일반
이러한 문자는 일반 라틴-알파벳 텍스트를위한 것이 아니라 발음 기호, 키릴-알파벳 텍스트, 수학 기호 (변수를 나타냄) 등으로 사용하기위한 것입니다. 기본 라틴 알파벳으로 텍스트를 인코딩하는 유일한 유니 코드 호환 방법은이 목적으로 주로 사용되는 문자를 사용하는 것입니다 (예 : 기본 라틴 유니 코드 블록에서).
다른 많은 표준과 마찬가지로 유니 코드 위반에 대해 두 번 생각해야합니다. 또한, 유니 코드는 많은 쓰기 시스템, 사용 사례, 그냥 다른 표준과의 호환성을 위해 존재 물건을 구비 한 완전하게 모든 동기를 이해하는 것은 자신의 과학이다. 간단히 말해, 실제로하고있는 일을 실제로 알지 않는 한, 원격으로 생각조차하지 않은 무언가가 깨질 가능성이 큽니다.
구체적인 예
접근성
인코딩 된 텍스트는 일부 글꼴로만 렌더링되는 것은 아닙니다. 예를 들어 스크린 리더로 해석 할 수도 있습니다. 스크린 리더는 다음을 추측 할 필요가 없습니다.
𝓽𝓱𝓮
은 변수 𝓽, 𝓱 및 𝓮 의 정관사 나 수학 곱 2 를 의미합니다. 이러한 문자는 이러한 문자의 용도입니다. 따라서 가장 좋은 동작은 문자 그대로 다음과 같은 문자를 나타내는 것입니다.
굵은 스크립트 작은 t, 굵은 스크립트 작은 h, 굵은 스크립트 작은 e
대신 "the"라고 말해서는 안됩니다. 왜냐하면 발음하기 쉬운 단어를 형성하는 기호가있는 수학 텍스트를 제대로 읽지 못하기 때문입니다. 삼
이식성
텍스트가 컴퓨터에서 제대로 렌더링되었다고해서 독자의 텍스트에도 해당되는 것은 아닙니다. 가장 분명한 예는 독자에게 이러한 문자를 지원하는 글꼴이 없거나 대체 글꼴을 지원하지 않는 소프트웨어로 텍스트가 렌더링된다는 것입니다. 분명히, 이것은 점점 덜 일반화되고 있습니다. 난독증과 같은 일부 사람들은 이러한 문자를 지원할 가능성이 적은 특수 글꼴이 필요하다는 점을 명심하십시오.
그러나 독자의 기기가 다른 글꼴 만 사용하더라도 텍스트를 읽기 어렵게 만들 수 있습니다. A의 첫 번째 예 , 이것은 𝓉𝒽ℯ 개의 상이한 폰트 렌더링된다 :
Free Serif는 특수 문자를 사용하여 텍스트를 시뮬레이션 할 때, 즉 연속적인 획으로 필기를 시뮬레이션 할 때 원하는대로 텍스트를 렌더링합니다. 그러나 이러한 문자는 수학 기호로 사용하기 위해 만들어 졌으므로 연결이 의미가 없습니다. 따라서 수학 목적으로 특별히 설계된 STIX 의 렌더링 은 이러한 문자의 사용 방법과 더 일치합니다.
A의 두 번째 예를 들어 , 당신이 또는 어떤 이유로 독자 italicise "сᴜт мy вᴀʀ"을 가정합니다. 좋은 글꼴을 사용하면 4가됩니다 .
그 이유는 작은 대문자가 키릴 문자로 (부분적으로) 시뮬레이트되었으며 키릴 이탤릭체는 때로는 직립 문자 와 매우 다르게 보입니다 . 다시 말하지만, 이것은 올바른 행동입니다.
검색 가능성
A와 첫 번째 예, 당신이 적당한 검색 문자 𝒲 (수학 스크립트로 할 수있는 것이 무엇 고려 W ). 검색에 기본 모드 와 정확한 모드 (대개 대소 문자 구분 )의 두 가지 모드가 있다고 가정하십시오 . 이 문자는 다음과 같아야합니다.
기본 모드에서 w 또는 W 를 검색 할 때 발견됨 – 특수 문자를 검색 필드에 입력하거나 복사하여 붙여 넣기를 원하지 않는 사람들을 위해;
정확한 모드에서 𝒲을 검색 할 때 발견됨 – 수학적 문서에서 해당 변수가 언급 된 곳을 검색하고자하는 사람들을 위해;
위와 유사한 검색을 중단하여 정확한 모드에서 𝓌, w 또는 W 를 검색 할 때는 찾을 수 없습니다 .
그러나이 문자를 사용하여 일반 텍스트를 시뮬레이션 하는 경우 위와 충돌하는 정확한 모드에서 W 또는 𝒲을 검색 할 때이 문자를 찾아야합니다.
A와 두 번째 예를 라틴 문자와 그 반대를 검색 할 때 키릴 문자가 그들이 완전히 다른 것들로, 발견되지 않을 것을 고려하십시오. 그러나 키릴 문자를 사용하여 라틴어 작은 대문자를 시뮬레이션하는 경우 검색 기능을 손상시키지 않으려면이 작업이 필요합니다. 이것은 사람들이 희귀 한 라틴어-알파벳 단어를 검색하면 인기있는 키릴-알파벳 단어의 가짜 작은 대문자에 해당하는 (그리고 그 반대의 경우) 많은 쓸모없는 것들을 찾게 할 것입니다.
정확한 검색 옵션은 알파벳의 다른 목적으로 예약되어 있으므로이 문제를 해결할 수 없습니다.
일반적으로 스타일이 지정된 라틴 텍스트를 시뮬레이트하기 위해 특수 문자를 사용하여 손상되지 않은 검색 옵션을 작성하는 것은 불가능합니다.
1 XKCD가 통일 표준의 실패에 대해 알고 있습니까? 글쎄, 유니 코드는 성공했다.
2 또는 빈 연산자가 관련 규칙에있는 것
3 오늘날 나는이 인코딩이나 그와 호환되는 것을 지원하는 수학 텍스트가 거의 없다는 것을 알고 있습니다. 유니 코드 악용 텍스트는 여전히 주변에있을 수 있습니다.
4 마케도니아 어 또는 세르비아어로 현지화하지 않는 한, 다르지만 여전히 원하지 않는 결과가 나타납니다.