«utf-8» 태그된 질문

UTF-8은 1-4 바이트의 바이트 시퀀스를 사용하여 각 유니 코드 코드 포인트를 설명하는 문자 인코딩입니다. 모든 유니 코드 코드 포인트의 표현을 지원하면서 ASCII와 역 호환됩니다.

14
파이썬에서 파일을 읽고 쓰는 유니 코드 (UTF-8)
텍스트를 읽고 파일로 쓰는 것을 이해하는 데 약간의 두뇌 장애가 있습니다 (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ( "u'Capit \ xe1n '", "'Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() …
329 python  unicode  utf-8  io 

24
인코딩을 감지하고 모든 것을 UTF-8로 만듭니다.
다양한 RSS 피드에서 많은 텍스트를 읽고 데이터베이스에 삽입하고 있습니다. 물론 피드에 사용되는 여러 가지 다른 문자 인코딩 (예 : UTF-8 및 ISO 8859-1)이 있습니다. 불행히도 때때로 텍스트 인코딩에 문제가 있습니다. 예: "Fußball"의 "ß"는 내 데이터베이스에서 다음과 같아야합니다 : "Ÿ". "Â"인 경우 올바르게 표시됩니다. 때때로, "Fußball"의 "ß"는 내 데이터베이스에서 다음과 같이 …

5
UTF-8 : 일반? 큰 상자? 유니 코드?
다양한 유형의 데이터에 어떤 데이터 정렬을 사용 해야하는지 파악하려고합니다. 내가 저장할 콘텐츠의 100 %가 사용자가 제출했습니다. 내 이해는 UTF-8 이진 대신 UTF-8 일반 CI (대소 문자 구분)를 사용해야한다는 것입니다. 그러나 UTF-8 General CI와 UTF-8 Unicode CI의 명확한 차이점을 찾을 수 없습니다. 사용자가 제출 한 컨텐츠를 UTF-8 General 또는 UTF-8 Unicode …
279 mysql  utf-8  collation 




2
파이썬에서 UTF-8로 UTF-8 디코딩
나는 파이썬에서 초보자 인 한 많은 시간을 보냈다. 그런 URL을 어떻게 해독 할 수 있습니까? example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 파이썬 2.7에서 이것에 : example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) 아주 못생긴 것을 반환합니다. 여전히 해결책이 없으며 도움을 주시면 감사하겠습니다.

11
UTF-8 바이트 []에서 문자열로
BufferedInputStreamUTF-8로 인코딩 된 텍스트 파일의 바이트를 바이트 배열로 읽는 데 방금 사용했다고 가정 해 봅시다 . 다음 루틴을 사용하여 바이트를 문자열로 변환 할 수 있지만 바이트를 반복하고 각 바이트를 변환하는 것보다 더 효율적이고 똑똑한 방법이 있습니까? public String openFileToString(byte[] _bytes) { String file_string = ""; for(int i = 0; i …
243 java  utf-8 

17
JDBC를 통해 MySQL에 UTF-8을 삽입하려고 할 때 "잘못된 문자열 값"?
이것은 내 연결이 설정된 방법입니다. Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); 그리고 테이블에 행을 추가하려고 할 때 다음 오류가 발생합니다. Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 수천 개의 레코드를 삽입하고 있는데 텍스트에 \ xF0이 포함 된 경우 항상이 오류가 발생합니다 (즉, 잘못된 …
228 mysql  jdbc  utf-8  utf8mb4 

16
'&'를 '& amp;'로 인코딩해야합니까?
&내 사이트에서 HTML5 및 UTF-8과 함께 ' '기호를 사용하고 있습니다 <title>. Google은 제목의 모든 브라우저와 마찬가지로 SERP에 앰퍼샌드를 표시합니다. http://validator.w3.org 가 나에게 이것을주고 있습니다 : & 문자 참조를 시작하지 않았습니다. (그리고 아마도로 탈출했을 것 &입니다.) 정말로해야합니까 &? 유효성 검사를 위해 유효성을 검사하는 내 페이지에 대해 소란스럽지 않지만 이것에 대한 사람들의 …

4
파이썬에서 UTF-8 파일에 쓰기
나는 정말로와 혼동된다 codecs.open function. 내가 할 때 : file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() 그것은 나에게 오류를 준다 UnicodeDecodeError : 'ascii'코덱이 0 위치의 바이트 0xef를 디코딩 할 수 없습니다 : 서 수가 범위 내에 있지 않습니다 (128) 만약 내가한다면: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() 잘 작동합니다. 질문 …

8
HTML 인코딩 문제- "& nbsp;"대신 "Â"문자가 나타남
확실하지 않은 어떤 이유로 든 기존 앱이 잘못 작동하기 시작했습니다. ActivePDF에 의해 PDF 보고서로 변환되는 HTML을 많이 생성합니다. 프로세스는 다음과 같이 작동합니다. 교체 할 토큰이있는 DB에서 HTML 템플릿을 가져옵니다 (예 : "~ CompanyName ~", "~ CustomerName ~"등). 토큰을 실제 데이터로 교체 속성에 HTML 태그 속성 값의 서식을 지정하는 간단한 정규식 …

12
UTF-8을 올바르게 인코딩하지 않는 PHP DOMDocument loadHTML
DOMDocument를 사용하여 일부 HTML을 구문 분석하려고하지만 그렇게하면 갑자기 인코딩이 손실됩니다 (적어도 그것이 나에게 나타나는 방식입니다). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } 이 코드의 결과는 일본어가 아닌 많은 문자를 얻는 것입니다. 그러나 내가 할 경우 : …

9
파이썬에서 문자열을 UTF-8로 변환하는 방법
utf-8 문자를 Python 서버로 보내는 브라우저가 있지만 쿼리 문자열에서 검색하면 Python이 반환하는 인코딩은 ASCII입니다. 일반 문자열을 utf-8로 어떻게 변환 할 수 있습니까? 참고 : 웹에서 전달 된 문자열은 이미 UTF-8로 인코딩되어 있으므로 ASCII가 아닌 UTF-8로 처리하도록 Python을 만들고 싶습니다.

30
Excel에서 올바르게 읽을 수 있도록 PHP에서 UTF-8 CSV를 출력하려면 어떻게해야합니까?
CSV 형식으로 물건을 출력하는 매우 간단한 것이 있지만 UTF-8이어야합니다. 이 파일을 TextEdit, TextMate 또는 Dreamweaver에서 열고 UTF-8 문자를 올바르게 표시하지만 Excel에서 열면이 어리석은 일을 대신하고 있습니다. 문서의 머리 부분에 다음과 같은 내용이 있습니다. header("content-type:application/csv;charset=UTF-8"); header("Content-Disposition:attachment;filename=\"CHS.csv\""); 이 모든 것은 Excel (Mac, 2008)이 올바르게 가져 오기를 원하지 않는 것을 제외하고는 원하는 효과가있는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.