«unicode» 태그된 질문

유니 코드는 모든 필기 시스템, 기술 기호 및 문장 부호를 포함하는 필기 텍스트에 필요한 모든 문자를 지원할 목적으로 텍스트의 인코딩, 표현 및 처리를위한 표준입니다.

6
Java FileReader 인코딩 문제
java.io.FileReader를 사용하여 일부 텍스트 파일을 읽고 문자열로 변환하려고 시도했지만 결과가 잘못 인코딩되어 읽을 수 없다는 것을 알았습니다. 내 환경은 다음과 같습니다. Windows 2003, OS 인코딩 : CP1252 자바 5.0 내 파일은 UTF-8로 인코딩되거나 CP1252로 인코딩되며 일부 (UTF-8로 인코딩 된 파일)에는 중국어 (라틴 문자가 아닌) 문자가 포함될 수 있습니다. 다음 코드를 …
130 java  file  unicode  encoding 

12
기호, 악센트 문자를 영어 알파벳으로 변환
문제는 아시다시피 유니 코드 차트에 수천 개의 문자 가 있으며 모든 유사한 문자를 영어 알파벳 문자로 변환하고 싶습니다. 예를 들어 다음은 몇 가지 변환입니다. ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... 그리고 A / a가 20 개가 넘는 버전이 있다는 것을 알았습니다. 그리고 그것들을 분류하는 방법을 …

7
정규화 된 UTF-8이란 무엇입니까?
ICU 프로젝트는 (또한 지금 갖고있는 PHP 라이브러리를 ) 검색 할 때 쉽게 값을 비교할 수 있도록 도움 정규화 UTF-8 문자열에 필요한 클래스가 포함되어 있습니다. 그러나 이것이 응용 프로그램에 대한 의미 를 알아 내려고 노력 중 입니다. 예를 들어 어떤 경우에 "호환성 동등성"대신 "정식 동등성"을 원하십니까?


8
HTML 문자 코드 8203은 무엇입니까?
문자 코드 (HTML)는 ​무엇입니까? jQuery 스크립트 중 하나에서 찾은 것이 무엇인지 궁금했습니다. 감사. 편집하다: 여기에 스크립트가 있습니다 (끝에 추가되어 Firebug에서 발견되었습니다) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); }, function() { if(!$jnyh(this).data('pinned')) $jnyh(".show-hide-nyh").slideUp("slow"); }); $jnyh("#title-nyh").click(function() { $jnyh(this).parent().toggleClass("title-btm-brdr"); $jnyh(this).toggleClass("chev-up-result"); var pin = $jnyh(this).data('pinned'); $jnyh(this).data('pinned', …

3
Java 정규식에서 \ w 및 \ b에 해당하는 유니 코드?
많은 최신 정규식 구현에서는 \w문자 클래스 속기를 "모든 문자, 숫자 또는 연결 구두점"(일반적으로 밑줄)으로 해석합니다 . 그런 식으로, 같은 정규식 \w+일치하는 단어는 좋아 hello, élève, GOÄ_432또는 gefräßig. 불행히도 Java는 그렇지 않습니다. 자바에서 \w제한됩니다 [A-Za-z0-9_]. 이로 인해 위에서 언급 한 것과 같은 단어를 일치시키기가 어렵고 다른 문제가 있습니다. 또한 \b단어 구분자가 …

7
Python- 'ascii'코덱이 바이트를 디코딩 할 수 없습니다.
정말 혼란 스러워요. 인코딩을 시도했지만 오류가 발생했습니다 can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) 문자열에 "u"접두사가있는 오류를 피하는 방법을 알고 있습니다. 인코딩이 호출되었을 때 오류가 "디코딩 할 수 …

10
유니 코드 문자가 JavaScript의 HTML에서 이모티콘으로 렌더링되는 것을 방지하는 방법은 무엇입니까?
FileFormat.Info의 검색 에서 특수 문자에 대한 유니 코드를 찾고 있습니다. 일부 문자는 ⚠ (경고 기호 \u26A0또는 ⚠) 와 같은 고전적인 흑백 글리프로 렌더링됩니다 . CSS 스타일 (예 : 색상)을 적용 할 수 있기 때문에 선호됩니다. 다른 사람들은 ⌛ (모래 시계 \u231B또는 ⌛) 와 같은 최신 만화 이모티콘으로 렌더링 합니다. 나는 …
119 javascript  html  css  unicode  emoji 


13
번호에서 유니 코드 문자 만들기
Java로 유니 코드 문자를 표시하고 싶습니다. 이렇게하면 잘 작동합니다. String symbol = "\u2202"; 기호는 "∂"와 같습니다. 그게 내가 원하는 것입니다. 문제는 내가 유니 코드 번호를 알고 있고 그로부터 유니 코드 기호를 만들어야한다는 것입니다. 나는 명백한 것을 시도했다. int c = 2202; String symbol = "\\u" + c; 그러나이 경우 symbol은 …

6
Perl에서 UTF-8을 어떻게 출력 할 수 있습니까?
"utf8"pragma를 사용하여 Perl 스크립트를 작성하려고하는데 예상치 못한 결과가 나타납니다. Mac OS X 10.5 (Leopard)를 사용하고 있으며 TextMate로 편집하고 있습니다. 내 편집기와 운영 체제에 대한 모든 설정은 기본적으로 utf-8 형식으로 파일을 작성하도록되어 있습니다. 그러나 텍스트 파일에 다음을 입력하고 ".pl"로 저장하고 실행하면 ASCII가 아닌 문자 대신 친숙한 "물음표가있는 다이아몬드"가 표시됩니다. #!/usr/bin/env perl …
110 perl  unicode  utf-8 

3
UTF-8“가변 너비 인코딩”은 어떻게 작동합니까?
유니 코드 표준에는 모두 저장하는 데 4 바이트가 필요한 충분한 코드 포인트가 있습니다. 이것이 UTF-32 인코딩이하는 일입니다. 그러나 UTF-8 인코딩은 "가변 너비 인코딩"이라는 것을 사용하여이를 훨씬 더 작은 공간으로 압축합니다. 실제로 US-ASCII의 처음 127 개 문자를 실제 ASCII와 똑같이 보이는 단 1 바이트로 표현할 수 있으므로 아무 작업도하지 않고도 많은 …

3
실제로 사용되는 가장 일반적인 비 BMP 유니 코드 문자는 무엇입니까? [닫은]
닫힘 . 이 질문은 더 집중되어야 합니다. 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중하도록 질문을 업데이트하십시오 . 휴일 육년 전 . 이 질문 개선 경험상 어떤 유니 코드 문자, 코드 포인트, BMP (Basic Multilingual Plane) 밖의 범위가 지금까지 가장 …

5
유니 코드 문자를 URL 인코딩하는 올바른 방법은 무엇입니까?
비표준 % uxxxx 체계에 대해 알고 있지만 W3C에서 해당 체계를 거부했기 때문에 현명한 선택이 아닌 것 같습니다. 몇 가지 흥미로운 예 : 하트 캐릭터. 내 브라우저에 이것을 입력하면 : http://www.google.com/search?q=♥ 그런 다음 복사하여 붙여 넣으면이 URL이 표시됩니다. http://www.google.com/search?q=%E2%99%A5 Firefox (또는 Safari)가이 작업을 수행하는 것처럼 보입니다. urllib.quote_plus(x.encode("latin-1")) '%E2%99%A5' 3 점 문자처럼 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.