«unicode» 태그된 질문

유니 코드는 모든 필기 시스템, 기술 기호 및 문장 부호를 포함하는 필기 텍스트에 필요한 모든 문자를 지원할 목적으로 텍스트의 인코딩, 표현 및 처리를위한 표준입니다.


5
정말 좋고 나쁜 UTF-8 예제 테스트 데이터 [닫힌]
닫은. 이 질문은 Stack Overflow 지침을 충족하지 않습니다 . 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? Stack Overflow의 주제에 맞게 질문을 업데이트하세요 . 휴일 삼년 전에 . 이 질문 개선 그래서 우리는 XSS 필터링을 테스트하기 위한 XSS 치트 시트 를 가지고 있습니다. 그러나 무해한 예제 페이지 외에는 내 …
88 unicode  utf-8 

8
Java에서 인쇄 할 수없는 유니 코드 문자를 어떻게 바꿀 수 있습니까?
다음은 ASCII 제어 문자 (의 약어)를 대체합니다 [\x00-\x1F\x7F]. my_string.replaceAll("\\p{Cntrl}", "?"); 다음은 [\p{Graph}\x20]악센트 부호가있는 문자를 포함하여 인쇄 할 수없는 모든 ASCII 문자 (의 약어)를 대체합니다 . my_string.replaceAll("[^\\p{Print}]", "?"); 그러나 유니 코드 문자열에는 둘 다 작동하지 않습니다. 누구든지 유니 코드 문자열에서 인쇄 할 수없는 문자를 제거하는 좋은 방법이 있습니까?
88 java  string  unicode 

12
TCHAR은 여전히 ​​관련이 있습니까?
저는 Windows 프로그래밍을 처음 접했고 Petzold 책을 읽은 후 궁금합니다. TCHAR유형과 _T()함수 를 사용하여 문자열을 선언 하는 것이 여전히 좋은 습관 입니까? 아니면 새 코드에서 wchar_t및 L""문자열을 사용해야 합니까? Windows 2000 이상 만 대상 으로하고 시작부터 코드는 i18n 이됩니다.
87 c++  c  windows  unicode  wchar-t 

2
C ++ wchar_t 및 wstrings에서 "잘못된"것은 무엇입니까? 와이드 문자의 대안은 무엇입니까?
나는의 사용을 원망는 C ++ 커뮤니티 (는 Freenode에 특히 ## C ++)에서 많은 사람들을 보았다 wstrings하고 wchar_t, 그리고 윈도우 API에서의 사용. wchar_t및 wstring에서 정확히 "잘못된"것은 무엇이며 국제화를 지원하려는 경우 와이드 문자에 대한 몇 가지 대안은 무엇입니까?


6
'use utf8;'사용 나에게 '넓은 글자 인쇄'제공
다음 Perl 프로그램을 실행하면 : perl -e 'use utf8; print "鸡\n";' 이 경고가 나타납니다. Wide character in print at -e line 1. 이 Perl 프로그램을 실행하면 : perl -e 'print "鸡\n";' 나는 경고를받지 않는다. use utf8Perl 스크립트에서 UTF-8 문자를 사용해야 한다고 생각했습니다 . 이것이 작동하지 않는 이유는 무엇이며 어떻게 해결할 …
86 perl  unicode  utf-8 

2
Regex : InCombiningDiacriticalMarks 란 무엇입니까?
다음 코드는 악센트 부호가있는 문자를 일반 텍스트로 변환하는 것으로 잘 알려져 있습니다. Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); "손으로 만든"방법을이 방법으로 대체했지만 replaceAll의 "정규식"부분을 이해해야합니다. 1) "InCombiningDiacriticalMarks"는 무엇입니까? 2) 문서는 어디에 있습니까? (그리고 유사?) 감사.
86 java  regex  unicode 

1
WebClient.DownloadString으로 인해 인코딩 문제로 인해 문자가 왜곡되지만 브라우저는 정상입니다.
다음 코드 : var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); text다른 많은 것들 중에서 문자열을 포함 하는 변수 가됩니다. "$ κ $ -Minkowski 공간, 스칼라 필드 및 Lorentz 불변의 문제" 그러나 Firefox에서 해당 URL을 방문하면 $ κ $ -Minkowski 공간, 스칼라 필드, 로렌츠 불변 문제 실제로 맞습니다. 나는 또한 시도했다 var data …



5
MySQL VARCHAR 길이 및 UTF-8
MySQL VARCHAR(32)에서 UTF-8 테이블에 새 필드를 만들면 해당 필드에 32 바이트의 데이터를 저장할 수 있는지 아니면 32 자 (멀티 바이트)를 저장할 수 있습니까?
84 mysql  unicode  utf-8  varchar 

3
Python에서 unicode () 및 encode () 함수 사용
경로 변수 를 인코딩 하고 SQLite 데이터베이스에 삽입하는 데 문제가 있습니다. 도움이되지 않는 encode ( "utf-8") 함수 로 해결하려고했습니다 . 그럼 내가 사용하는 유니 코드 () 나 입력주는 기능 유니 코드를 . print type(path) # <type 'unicode'> path = path.replace("one", "two") # <type 'str'> path = path.encode("utf-8") # <type 'str'> …

6
유니 코드로 몇 개의 문자를 매핑 할 수 있습니까?
설명과 함께 유니 코드로 가능한 모든 유효한 조합의 개수를 요청하고 있습니다. 나는 문자가 1,2,3 또는 4 바이트로 인코딩 될 수 있다는 것을 알고 있습니다. 또한 해당 문자의 시작 바이트가 얼마나 오래되어야하는지 지워도 연속 바이트에 제한이있는 이유를 이해하지 못합니다.
82 unicode  utf-8  utf 

8
C 프로그래밍 : 유니 코드 용으로 프로그래밍하는 방법?
엄격한 유니 코드 프로그래밍을 수행하려면 어떤 전제 조건이 필요합니까? 이 내 코드는 사용하지 말아야 것을 의미합니까 char어디서나 종류와 그 기능을 처리 할 수있는 사용해야 wint_t하고 wchar_t? 그리고이 시나리오에서 멀티 바이트 문자 시퀀스가 ​​수행하는 역할은 무엇입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.