«unicode» 태그된 질문

유니 코드는 모든 필기 시스템, 기술 기호 및 문장 부호를 포함하는 필기 텍스트에 필요한 모든 문자를 지원할 목적으로 텍스트의 인코딩, 표현 및 처리를위한 표준입니다.

17
문자 집합간에 텍스트 파일을 변환하는 가장 좋은 방법은 무엇입니까?
문자 집합간에 텍스트 파일을 변환하는 가장 빠르고 쉬운 도구 또는 방법은 무엇입니까? 특히 UTF-8에서 ISO-8859-15로 또는 그 반대로 변환해야합니다. 좋아하는 스크립트 언어의 한 줄짜리 도구, 명령 줄 도구 또는 OS, 웹 사이트 등의 기타 유틸리티 지금까지 최고의 솔루션 : Linux / UNIX / OS X / cygwin에서 : Troels Arvin …

8
파이썬 유니 코드 문자열에서 악센트를 제거하는 가장 좋은 방법은 무엇입니까?
파이썬에는 유니 코드 문자열이 있으며 모든 악센트 (분음 부호)를 제거하고 싶습니다. 웹에서 Java로 이것을 수행하는 우아한 방법을 찾았습니다. 유니 코드 문자열을 긴 정규화 된 형식으로 변환하십시오 (문자와 분음 부호에 별도의 문자 사용) 유니 코드 유형이 "분음 부호"인 모든 문자를 제거하십시오. pyICU와 같은 라이브러리를 설치해야합니까, 아니면 파이썬 표준 라이브러리만으로 가능합니까? 그리고 …



12
UTF-8, UTF-16 및 UTF-32
UTF-8, UTF-16 및 UTF-32의 차이점은 무엇입니까? 나는 그들이 모두 유니 코드를 저장하고 각각 다른 바이트 수를 사용하여 문자를 나타냅니다. 다른 것을 선택하면 이점이 있습니까?
486 unicode  utf-8  utf-16  utf  utf-32 

12
json.dumps에서 utf-8 텍스트를 \ u 이스케이프 시퀀스가 ​​아닌 UTF8로 저장
샘플 코드 : >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" 문제 : 사람이 읽을 수 없습니다. 내 (스마트) 사용자는 JSON 덤프로 텍스트 파일을 확인하거나 편집하려고합니다 (XML을 사용하지 않겠습니다). 객체 대신 UTF-8 JSON 문자열로 객체를 직렬화하는 방법이 \uXXXX있습니까?
474 python  json  unicode  utf-8  escaping 

30
문자열을 바꾸는 가장 좋은 방법
방금 C # 2.0에서 문자열 반전 함수를 작성해야했습니다 (즉 LINQ를 사용할 수 없음). public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; } return reverse; } 개인적으로 나는 그 기능에 열중하지 …

18
Python을 사용하여 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError
30,000 개의 유사한 파일을 처리하는 프로그램을 실행 중입니다. 임의의 숫자 가이 오류를 중지하고 생성합니다 ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret = …


9
유니 코드, UTF-8, UTF-16이란 무엇입니까?
유니 코드의 기초는 무엇이며 왜 UTF-8 또는 UTF-16이 필요한가? 나는 이것을 Google에서 조사하고 여기에서도 검색했지만 명확하지 않습니다. VSS에서 파일 비교를 수행 할 때 두 파일의 UTF가 다르다는 메시지가 표시되는 경우가 있습니다. 왜 이런 경우입니까? 간단한 용어로 설명하십시오.

5
2+ 40이 42 인 이유는 무엇입니까?
동료가이 JavaScript 알림 라인을 보여줄 때 당황했습니다 42. alert(2+ 40); 코드 스 니펫 실행결과 숨기기스 니펫 확장 빼기 부호처럼 보이는 것이 실제로 의미가 다른 비전의 유니 코드 문자라는 것이 금방 밝혀졌습니다. 이것은 표현식이 구문 분석 될 때 해당 문자가 구문 오류를 생성하지 않는 이유를 궁금하게했습니다. 또한 이와 같이 동작하는 문자가 …

11
ASCII가 아닌 모든 문자를 어떻게 grep합니까?
매우 큰 XML 파일이 여러 개 있으며 ASCII가 아닌 문자가 포함 된 줄을 찾으려고합니다. 나는 다음을 시도했다. grep -e "[\x{00FF}-\x{FFFF}]" file.xml 그러나 행에 지정된 범위의 문자가 포함되어 있는지 여부에 관계없이 파일의 모든 행을 반환합니다. 구문이 잘못되었거나 다른 일을하고 있습니까? 나는 또한 시도했다 : egrep "[\x{00FF}-\x{FFFF}]" file.xml (패턴을 둘러싼 작은 따옴표와 …
359 regex  unix  unicode  grep 


6
R에서 문자열의 길이를 찾는 방법
R에서 나누지 않고 문자열의 길이 (문자열의 문자 수)를 찾는 방법은 무엇입니까? 문자열의 길이가 아닌 목록의 길이를 찾는 방법을 알고 있습니다. 그리고 유니 코드 문자열은 어떻습니까? 유니 코드 문자열에서 길이 (바이트)와 문자 수 (런, 기호)를 찾으려면 어떻게합니까? 관련 질문 : R의 유니 코드 문자열에서 "실제"문자 수를 찾는 방법

14
파이썬에서 파일을 읽고 쓰는 유니 코드 (UTF-8)
텍스트를 읽고 파일로 쓰는 것을 이해하는 데 약간의 두뇌 장애가 있습니다 (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ( "u'Capit \ xe1n '", "'Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() …
329 python  unicode  utf-8  io 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.