프로그램 작성 unicode

17

문자 집합간에 텍스트 파일을 변환하는 가장 빠르고 쉬운 도구 또는 방법은 무엇입니까? 특히 UTF-8에서 ISO-8859-15로 또는 그 반대로 변환해야합니다. 좋아하는 스크립트 언어의 한 줄짜리 도구, 명령 줄 도구 또는 OS, 웹 사이트 등의 기타 유틸리티 지금까지 최고의 솔루션 : Linux / UNIX / OS X / cygwin에서 : Troels Arvin …

526 text unicode utf-8 character-set

8

파이썬 유니 코드 문자열에서 악센트를 제거하는 가장 좋은 방법은 무엇입니까?

파이썬에는 유니 코드 문자열이 있으며 모든 악센트 (분음 부호)를 제거하고 싶습니다. 웹에서 Java로 이것을 수행하는 우아한 방법을 찾았습니다. 유니 코드 문자열을 긴 정규화 된 형식으로 변환하십시오 (문자와 분음 부호에 별도의 문자 사용) 유니 코드 유형이 "분음 부호"인 모든 문자를 제거하십시오. pyICU와 같은 라이브러리를 설치해야합니까, 아니면 파이썬 표준 라이브러리만으로 가능합니까? 그리고 …

506 python python-3.x unicode python-2.x diacritics

15

UTF-8과 유니 코드의 차이점은 무엇입니까?

Wikipedia UTF-8 페이지 에 따르면 사람들의 의견이 상충되는 것으로 들었습니다 . 그들은 똑같지 않습니까? 누군가가 명확히 할 수 있습니까?

503 unicode encoding utf-8 character-encoding terminology

9

유니 코드 문자열을 Python의 문자열로 변환 (추가 기호 포함)

£ $와 같은 추가 문자가 포함 된 유니 코드 문자열을 파이썬 문자열로 어떻게 변환합니까?

503 python string unicode type-conversion

12

UTF-8, UTF-16 및 UTF-32

UTF-8, UTF-16 및 UTF-32의 차이점은 무엇입니까? 나는 그들이 모두 유니 코드를 저장하고 각각 다른 바이트 수를 사용하여 문자를 나타냅니다. 다른 것을 선택하면 이점이 있습니까?

486 unicode utf-8 utf-16 utf utf-32

12

json.dumps에서 utf-8 텍스트를 \ u 이스케이프 시퀀스가 아닌 UTF8로 저장

샘플 코드 : >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" 문제 : 사람이 읽을 수 없습니다. 내 (스마트) 사용자는 JSON 덤프로 텍스트 파일을 확인하거나 편집하려고합니다 (XML을 사용하지 않겠습니다). 객체 대신 UTF-8 JSON 문자열로 객체를 직렬화하는 방법이 \uXXXX있습니까?

474 python json unicode utf-8 escaping

30

문자열을 바꾸는 가장 좋은 방법

방금 C # 2.0에서 문자열 반전 함수를 작성해야했습니다 (즉 LINQ를 사용할 수 없음). public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; } return reverse; } 개인적으로 나는 그 기능에 열중하지 …

440 c# .net performance algorithm unicode

18

Python을 사용하여 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError

30,000 개의 유사한 파일을 처리하는 프로그램을 실행 중입니다. 임의의 숫자 가이 오류를 중지하고 생성합니다 ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret = …

411 python pandas csv dataframe unicode

9

ASCII와 유니 코드의 차이점은 무엇입니까?

유니 코드와 ASCII의 정확한 차이점은 무엇입니까? ASCII는 총 128 자입니다 (확장 세트에서 256 자). 유니 코드 문자에 대한 크기 지정이 있습니까?

407 unicode ascii

9

유니 코드, UTF-8, UTF-16이란 무엇입니까?

유니 코드의 기초는 무엇이며 왜 UTF-8 또는 UTF-16이 필요한가? 나는 이것을 Google에서 조사하고 여기에서도 검색했지만 명확하지 않습니다. VSS에서 파일 비교를 수행 할 때 두 파일의 UTF가 다르다는 메시지가 표시되는 경우가 있습니다. 왜 이런 경우입니까? 간단한 용어로 설명하십시오.

395 unicode encoding utf-8 utf-16

5

2+ 40이 42 인 이유는 무엇입니까?

동료가이 JavaScript 알림 라인을 보여줄 때 당황했습니다 42. alert(2+ 40); 코드 스 니펫 실행결과 숨기기스 니펫 확장 빼기 부호처럼 보이는 것이 실제로 의미가 다른 비전의 유니 코드 문자라는 것이 금방 밝혀졌습니다. 이것은 표현식이 구문 분석 될 때 해당 문자가 구문 오류를 생성하지 않는 이유를 궁금하게했습니다. 또한 이와 같이 동작하는 문자가 …

360 javascript unicode

11

ASCII가 아닌 모든 문자를 어떻게 grep합니까?

매우 큰 XML 파일이 여러 개 있으며 ASCII가 아닌 문자가 포함 된 줄을 찾으려고합니다. 나는 다음을 시도했다. grep -e "[\x{00FF}-\x{FFFF}]" file.xml 그러나 행에 지정된 범위의 문자가 포함되어 있는지 여부에 관계없이 파일의 모든 행을 반환합니다. 구문이 잘못되었거나 다른 일을하고 있습니까? 나는 또한 시도했다 : egrep "[\x{00FF}-\x{FFFF}]" file.xml (패턴을 둘러싼 작은 따옴표와 …

359 regex unix unicode grep

2

유니 코드, UTF, ASCII, ANSI 형식 차이

사이의 차이는 무엇입니까 Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, 및 ANSI인코딩은? 이것들은 프로그래머에게 어떤 도움이됩니까?

351 unicode character-encoding ascii ansi utf

6

R에서 문자열의 길이를 찾는 방법

R에서 나누지 않고 문자열의 길이 (문자열의 문자 수)를 찾는 방법은 무엇입니까? 문자열의 길이가 아닌 목록의 길이를 찾는 방법을 알고 있습니다. 그리고 유니 코드 문자열은 어떻습니까? 유니 코드 문자열에서 길이 (바이트)와 문자 수 (런, 기호)를 찾으려면 어떻게합니까? 관련 질문 : R의 유니 코드 문자열에서 "실제"문자 수를 찾는 방법

348 r string unicode string-length

14

파이썬에서 파일을 읽고 쓰는 유니 코드 (UTF-8)

텍스트를 읽고 파일로 쓰는 것을 이해하는 데 약간의 두뇌 장애가 있습니다 (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ( "u'Capit \ xe1n '", "'Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() …

329 python unicode utf-8 io

«unicode» 태그된 질문