«unicode» 태그된 질문

유니 코드는 모든 필기 시스템, 기술 기호 및 문장 부호를 포함하는 필기 텍스트에 필요한 모든 문자를 지원할 목적으로 텍스트의 인코딩, 표현 및 처리를위한 표준입니다.

16
UnicodeDecodeError : 'ascii'코덱이 위치 1의 바이트 0xef를 디코딩 할 수 없습니다.
문자열을 UTF-8로 인코딩하는 데 몇 가지 문제가 있습니다. string.encode('utf-8')및 사용을 포함하여 여러 가지를 시도했지만 unicode(string)오류가 발생합니다. UnicodeDecodeError : 'ascii'코덱은 위치 1에서 0xef 바이트를 디코딩 할 수 없습니다. 서 수가 범위에 없습니다 (128). 이것은 내 문자열입니다. (。・ω・。)ノ 무슨 일이 일어나고 있는지 모르겠어요. 편집 : 문제는 문자열을 그대로 인쇄하는 것이 제대로 표시되지 …
106 python  unicode  utf-8 

3
문자열 중간에서 문화에 민감한 "시작"작업을 수행하려면 어떻게해야합니까?
나는 상대적으로 불분명 요구 사항을 가지고 있지만, 그것은 것처럼 느낀다 해야 BCL을 사용 가능하다. 컨텍스트를 위해 Noda Time 에서 날짜 / 시간 문자열을 구문 분석하고 있습니다 . 입력 문자열 내 위치에 대한 논리적 커서를 유지합니다. 따라서 전체 문자열은 "2013 년 1 월 3 일"일 수 있지만 논리적 커서는 'J'에있을 수 …
106 .net  string  unicode 

4
Java String의 유니 코드 코드 포인트를 어떻게 반복 할 수 있습니까?
그래서 나는에 대해 알고 String#codePointAt(int)있지만 char코드 포인트 오프셋이 아니라 오프셋에 의해 인덱싱됩니다 . 나는 다음과 같은 것을 시도하는 것에 대해 생각하고 있습니다. 인덱스 String#charAt(int)를 얻기 위해 사용char 대리자char 가 높은 범위 에 있는지 테스트 그렇다면 String#codePointAt(int)코드 포인트를 가져오고 인덱스를 2 씩 증가시킵니다. 그렇지 않은 경우 주어진 char값을 코드 포인트로 사용 …
105 java  string  unicode 


11
파이썬 인터프리터가 문자열 작업에서 ASCII가 아닌 문자를 올바르게 처리하도록 만드는 방법은 무엇입니까?
다음과 같은 문자열이 있습니다. 6Â 918Â 417Â 712 이 문자열을 자르는 명확한 방법은 (파이썬을 이해했듯이) 단순히 문자열이라는 변수에 있다고 말하는 것입니다 s. s.replace('Â ', '') 그게 트릭을해야합니다. 그러나 물론 '\xc2'blabla.py 파일 의 비 ASCII 문자 가 인코딩되지 않았다고 불평합니다 . 다른 인코딩으로 전환하는 방법을 이해할 수 없었습니다. 여기에 코드가 있습니다. …
104 python  unicode 

9
Python 유니 코드 인코딩 오류
Amazon XML 파일을 읽고 구문 분석 중이며 XML 파일에 '가 표시되는 동안 인쇄하려고하면 다음 오류가 발생합니다. 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) 지금까지 온라인에서 읽은 내용에서 오류는 XML 파일이 UTF-8로되어 있지만 Python은이를 ASCII 인코딩 문자로 처리하려고합니다. 오류를 없애고 프로그램이 읽는대로 XML을 인쇄하도록하는 간단한 …
104 python  unicode  ascii  encode 

12
JavaScript의 문자열 길이 (바이트)
내 JavaScript 코드에서 다음 형식으로 서버에 메시지를 작성해야합니다. <size in bytes>CRLF <data>CRLF 예: 3 foo 데이터에는 유니 코드 문자가 포함될 수 있습니다. UTF-8로 보내야합니다. JavaScript에서 문자열 길이를 바이트 단위로 계산하는 가장 크로스 브라우저 방법을 찾고 있습니다. 내 페이로드를 구성하기 위해 이것을 시도했습니다. return unescape(encodeURIComponent(str)).length + "\n" + str + "\n" …


8
파이썬 파일에서 문자 읽기
텍스트 파일에는 "I do n't like this"라는 문자열이 있습니다. 하지만 문자열로 읽어 오면 "I don \ xe2 \ x80 \ x98t like this"가됩니다. \ u2018이 " '"의 유니 코드 표현임을 이해합니다. 나는 사용한다 f1 = open (file1, "r") text = f1.read() 읽기 명령. 자, 문자열을 읽을 때 "I don \ …

5
Apache Commons는 왜 '१२३'숫자를 고려합니까?
에 대한 Apache Commons Lang의 문서에 따르면 StringUtils.isNumeric()'१२३'문자열은 숫자입니다. 문서의 실수라고 생각했기 때문에 테스트를 실행하여 진술을 확인했습니다. 나는 아파치 코 몬즈에 따라이 발견 입니다 숫자. 이 문자열이 숫자 인 이유는 무엇입니까? 그 캐릭터들은 무엇을 상징합니까?

6
Python 2.6에서 unicode_literals를 사용하는 문제가 있습니까?
우리는 이미 Python 2.6에서 실행되는 코드베이스를 얻었습니다. Python 3.0을 준비하기 위해 다음을 추가하기 시작했습니다. __future__에서 unicode_literals 가져 오기 우리로 .py파일 (우리가 그들을 수정으로). 나는 다른 누군가가 이것을하고 있고 분명하지 않은 문제가 발생했는지 궁금합니다 (아마도 많은 시간을 디버깅 한 후).

4
Python str 대 유니 코드 유형
파이썬 2.7 작업, 나는 진짜 장점은 형식을 사용하여이 무엇인지 궁금하네요 unicode대신 str둘 다 유니 코드 문자열을 보유 할 수있을 것 같은. unicode이스케이프 문자를 사용하여 문자열에 유니 코드 코드를 설정할 수 있다는 것 외에 특별한 이유가 \있습니까? : 다음을 사용하여 모듈 실행 : # -*- coding: utf-8 -*- a = 'á' …
101 python  string  unicode 

4
ggplot2에서 그리스어 기호를 사용하는 방법은 무엇입니까?
내 카테고리는 그리스 문자로 이름을 지정해야합니다. 나는을 사용 ggplot2하고 있으며 데이터와 함께 아름답게 작동합니다. 불행히도 나는 그 그리스 기호를 x 축 (눈금 표시)에 배치하고 범례에 표시하는 방법을 알 수 없습니다. 할 방법이 있습니까? 업데이트 : 나는 링크 를 보았지만 내가하고 싶은 것을 성취하기 위해 설명 된 좋은 방법이 없습니다.
101 r  graphics  unicode  utf-8  ggplot2 

7
ASCII가 아닌 문자를 제거하고 Python을 사용하여 마침표와 공백을 남기려면 어떻게해야합니까?
.txt 파일로 작업하고 있습니다. ASCII가 아닌 문자가없는 파일의 텍스트 문자열을 원합니다. 그러나 공백과 마침표를 남기고 싶습니다. 현재 나는 그것들도 벗겨 내고있다. 코드는 다음과 같습니다. def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) filtered_data = filtered_data.lower() return …
100 python  text  unicode  filter  ascii 

3
파일로 리디렉션 할 때 UnicodeDecodeError
나는 우분투 터미널에서 한 번에, (UTF-8로 설정을 인코딩), 두 번이 코드를 실행 ./test.py하고 다음과 ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni 리디렉션하지 않으면 쓰레기를 인쇄합니다. 리디렉션을 사용하면 UnicodeDecodeError가 발생합니다. 누군가 두 번째 경우에만 오류가 발생하는 이유를 설명하거나 두 경우 모두 커튼 뒤에서 일어나는 일에 대해 자세히 설명 할 수 있습니까?
100 python  unicode 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.