Windows에서 특정 문자가 끔찍하게 잘못 그려지는 이유는 무엇입니까?


16

홀수 문자 :

ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้

질문 : Windows *에서 문자를 볼 때 왜이 문자가 그렇게 이상하게 보입니까?

다음은 Windows를 사용하지 않는 운이 좋은 놈들을위한 Outlook의 스 니펫입니다.

물건

관련 : 사용 된 문자 인코딩은 무엇입니까?

* OS와 같은 Windows. GTK +와 좋아요를 사용하여 텍스트를 그리는 응용 프로그램은 LSD- 트립에서 잘못 된 것과 같은 것을 보여주지 않습니다 .


Windows 컴퓨터에서 질문에 입력 한 문자가 이미지의 문자처럼 보입니까? 입력 한 문자가 Windows 시스템에서 잘 보이기 때문입니다.
dsolimano 2019

1
귀하의 질문에 근거없는 주장이 포함되어 있습니다. Windows는이를 "잘못된"것으로 간주합니다. 어떻게 그려야한다고 생각하는지와 Windows가 그리는 방식에 구체적으로 무엇이 잘못되었는지 설명하면 도움이 될 것입니다.
David Schwartz

2
다른 OS가 어떻게 이것을 처리하는지 궁금합니다. Windows가 어떻게 그것을 수행하는지와 나에게 "올바른"것만 보입니다.
Mokubai


답변:


10

Windows가 "올바른 일을하고있다"는 생각에 약간의 타격을받은 것 같습니다. 제 입장을 정당화하기 위해 답을 게시해야한다고 생각합니다.

중요한 사실은 당신이 가지고있는 텍스트가 운영 체제에 엄청난 양의 결합 문자를 렌더링하도록 지시한다는 것입니다. 한 운영 체제가 실제로 렌더링하는 반면 다른 운영 체제는 렌더링하지 않는 문제는 여러 가지 문제로 인해 발생합니다. 이러한 문제 중 하나는 프로그래머가 코드를 작성했을 때 얼마나 철저한가에 관한 것이며, 다른 하나는 프로그래머가 전혀 구현하기에 너무 게으 르기 때문일 것입니다.

기본적으로 글을 쓰는 언어는 유동적이며 특정 언어의 많은 문자 에는 문자 발음을 수정하는 데 적용되는 여러 가지 발음 구별 기호 가 있습니다. 우리는 이러한 모든 분음 부호를 처리 어떻게 우리가 (새와 거의 동일한 문자의 많은 중 하나 개 지옥 초래) 분음 부호를 새로운 문자와 각 문자를 제공 할 또는 우리는 특히 문자 집합을 만들려면 어떻게해야합니까 에 대한 발음 구별 부호와 우리를 감소 전체 알파벳?

유니 코드는 우리에게 두 가지를 모두 할 수있는 범위를 제공하지만 그렇게하면이 분음 부호를 렌더링 해야하는 프로그래머는 실제로 여러 개의 분음 부호가있는 문자가 위와 아래에 하나씩 있다는 사실을 처리해야합니다. 그들이 언제 멈추는 지에 대한 질문을 그들은 그것을 2 개로 제한하고 대부분의 사람들을 만족시킬 수 있지만, 자신의 언어로 공식적으로 글을 쓰기 위해 3 개의 분음 부호를 원하거나 필요로하는 사람들은 무시합니다.

옳고 그르 든 Microsoft는 사용자가 사용하려는 추가 마크를 몇 개나 결정할지 결정했습니다. 이 길은 다소 좋은 프로그래머와 어려운 합리화가 필요합니다. 나는 완전히 모두이 수 있도록 그들을 지원 하고 그들이 그것을 할 수 있다는 사실 을 잘 .

반면에 해당 문자가 누락 된 경우 해당 문자가 누락 된 이유를 알고 싶습니다. 이것이 " x분음 부호 이후에 바닥에 떨어 뜨렸는가"인가, 아니면 프로그래머가 제대로 수행하기에는 너무 게으르고 분음 부호에 숨겨진 코드가있는 버퍼 오버 플로우에 노출 될 가능성이 있었기 때문일 것입니다. 시스템?

여기서 간단한 문제는 실제로 해당 문자를 렌더링 함으로써 시스템이 옳거나 나쁜 것으로 생각하는 것을 수행하는 것이 아니라 잠재적으로 해로운 일을하는 것이 아니라 지시받은대로 정확하게 수행하고 있음을 알 수 있습니다 .


11
또는 : 왜 Windows가 끔찍하고 끔찍하게 잘못된 문자를 그리워합니까?
mtone

다른 사람의 글을 다루는 것은 나의 책에서 "잠재적으로 유해한"기준에 부합합니다. (메시지가 포함 된 메시지가 중요 할 수도 있습니다.) 우연히 제가 선호하는 솔루션은 분음 부호의 수를 제한하는 것이 아니라 어떤 형태의 클리핑 일 것입니다. (실제로 인접한 줄의 문자와 겹치는 문자를 사용하는 언어가 있다면 그것에 대해 신경 쓰지 않아도됩니다!)
Harry Johnston

또한 MS는 조만간이 동작을 변경하지 않을 것이므로 사용자 데이터를 허용하는 Facebook 및 기타 사이트는 장난꾼이이 "기능"을 잘못 사용하지 못하도록 문자 자체를 삭제하려고 시도 할 것입니다. 불행하게도, 살균 공정은 바람직하지 않은 부작용을 가질 수있다. Windows가 출력을 클리핑하면 필요하지 않습니다.
Harry Johnston

4

Windows *에서 이러한 문자를 볼 때 왜 그렇게 이상한가?

Windows는 텍스트에 문자를 포함 할 때 많은 수의 유니 코드 결합 문자 를 렌더링하려고 시도 하지만 실제 스크립트는 그와 같은 마크를 결합하지 않습니다.


아마도 이것은 Windows가 실제로 사용되는 조합 문자 수에 제한을두기보다는 실제로 요청되는 내용에 따라 "올바르게 수행하고 있음"을 의미합니다.
Mokubai

또한 superuser.com/questions/389333/… 을 참조하십시오. 이러한 트릭은 Facebook에서 인기를 얻었음을 나타냅니다.
Jukka K. Korpela 2019

@ Mokubai : 것은 신뢰할 수없는 데이터입니다. 인터넷에서 오는 데이터입니다. Windows는 신뢰할 수없는 데이터가 사용자에게 최선의 이익이 아닐 수있는 경우이를 요구하지 않습니다.
Harry Johnston

1
@HarryJohnston 모든 분음 부호를 표시 하지 않으면 더 걱정됩니다 . 내 대답을 참조하십시오.
Mokubai
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.