편집 : 이제 질문에 "수백만 개의 새로운 캐릭터"가 있습니다. 이렇게하면 쉽게 대답 할 수 있습니다.
없음 . Utf-8은 유니 코드 인코딩입니다. 유니 코드에는 1,114,112 개의 고유 한 코드 포인트 를 허용하는 코드 공간 이 있으며 현재 백만 미만도 할당되지 않았습니다. 따라서 유니 코드로 수백만 개의 새로운 문자를 지원할 수 없습니다. 정의상 유니 코드 인코딩은 유니 코드로 정의 된 것보다 많은 문자를 지원할 수 없습니다. (물론 레벨을 더 인코딩하여 부정 행위를 할 수 있습니다. 모든 종류의 데이터는 결국 두 문자로 표현할 수 있습니다.)
원래 질문에 대답하려면 :
유니 코드는 언어를 지원하지 않으며 문자를 지원합니다. 문자를 문자로 표시하는 데 사용됩니다.
모든 사람의 언어로 작성된 표현이있는 것은 아니므로 모든 사람의 언어가 유니 코드로 지원되는 것은 아닙니다. 또한 많은 동물들이 의사 소통을하지만 글을 쓰지 않습니다. 예를 들어, 고래는 언어를 호출하기에는 복잡하지만 서면 형식이없는 통신 형식을 가지고 있습니다 (기존의 음성 표기법으로도 포착 할 수 없음). 따라서 지구상의 모든 언어조차도 유니 코드로 지원할 수있는 것은 아닙니다.
더 나쁜 것은 꿀벌의 언어와 같은 것입니다. 서면 양식이 없을뿐만 아니라 서면 양식으로도 의미가 없습니다. 언어는 기본적으로 어떤 방향을 가리 키지 만 태양의 현재 위치에 의존하는 일종의 춤입니다. 따라서이 춤은 공연이 진행되는 특정 장소와 시간에만 정보를 제공합니다. 상징적 또는 텍스트 표현은 꿀벌의 언어가 현재 표현할 수없는 정보 (태양의 위치, 위치)를 포함해야합니다.
서면 또는 상징적 형태의 커뮤니케이션조차도 유니 코드로 표현하지 못할 수 있습니다. 예를 들어 그림 문자 세트가 유한하지 않기 때문에 일러스트레이션이나 단어없는 만화는 유니 코드에서 지원할 수 없습니다. 공항과 같은 국제적인 환경에서 많은 그림의 커뮤니케이션을 알 수 있으므로 우주 여행 외계인이 그림 언어를 사용하도록 진화했을 것입니다.
외계인 종족이 유한 한 기호 세트를 가진 쓰기 시스템을 가진 언어를 가지고 있더라도이 시스템은 유니 코드로 지원하지 못할 수 있습니다. 유니 코드는 쓰기가 선형 순서의 기호 일 것으로 예상합니다. 음악 표기법은 기호의 선택과 수직 및 수평 배치로 의미가 인코딩되기 때문에 유니 코드로 완전히 표현할 수없는 필기 시스템의 예입니다. (유니 코드는 개별 음악 기호를 지원하지만 점수를 인코딩 할 수는 없습니다.) 다성 음악 (드문 경우는 아님) 또는 유사한 복잡도의 통신 채널을 사용하여 통신 한 외계인 인종은 오케스트라 악보와 같은 필기 시스템을 가지고있을 수 있습니다. 유니 코드는이를 지원할 수 없습니다.
그러나 모든 언어, 심지어 외국어조차도 유한 한 세트로부터 선택된 일련의 심볼로 표현 될 수 있다고 가정하자. 외계인의 침략을 위해 유니 코드가 충분히 큰가요? 유니 코드는 현재 할당되지 않은 코드 포인트가 백만 미만입니다. 중국어에는 가장 포괄적 인 중국어 사전에 따라 수십만 개의 문자가 포함되어 있습니다 (현재 모든 문자가 유니 코드에서 고유 문자로 지원되는 것은 아닙니다). 따라서 중국어가 복잡한 10 개 언어 만 모든 유니 코드를 사용합니다. 지구상에는 수백 가지의 독창적 인 작문 체계가 있지만 운 좋게도 대부분은 표의 문자가 아니라 알파벳순이므로 소수의 문자가 포함되어 있습니다. 만약 모든 언어가 중국어와 같은 표의 문자를 사용한다면, 유니 코드는 지구에 충분하지 않을 것입니다. 알파벳의 사용은 제한된 수의 음소 만 사용하는 음성에서 비롯되었지만 인간 생리학에 특화되어 있습니다. 따라서 십여 개의 표의 문자 체계 만 갖춘 외계인 행성조차도 유니 코드가 지원할 수있는 수준을 초과 할 수 있습니다. 이제이 외계인이 이미 지구보다 먼저 다른 행성을 침공했으며 지원해야 할 캐릭터 세트에 작문 시스템을 포함 시켰는지 고려하십시오.
현재 인코딩을 확장하거나 수정하거나 새 인코딩을 도입해도이 문제는 해결되지 않습니다. 유니 코드에서 지원하는 코드 포인트 수에 제한이 있기 때문입니다.
따라서 대답은 거의 없습니다.