«character-encoding» 태그된 질문

문자 인코딩은 문자가 일련의 바이트로 표시되는 방식을 나타냅니다. 웹의 문자 인코딩은 인코딩 표준에 정의되어 있습니다.

17
뒤집힌 캐럿 캐릭터가 있습니까?
많은 수의 클래식 ASP 페이지를 유지해야합니다. 대부분의 페이지에는 정렬 기능이없는 테이블 형식 데이터가 있습니다. 데이터베이스 쿼리에 사용 된 원래 개발자가 무엇을 주문하든 문제가 있습니다. 이 페이지들에 대한 몇 가지 기본 정렬을 다루고 싶습니다. 모든 클라이언트 측에서 자바 스크립트를 사용하고 있습니다. 주어진 열의 주어진 테이블에서 주어진 방향으로 주어진 테이블을 정렬하기 위해 …


8
텍스트 파일에 유니 코드 텍스트를 작성 하시겠습니까?
Google 문서에서 데이터를 가져 와서 처리하고 파일에 씁니다 (결국 Wordpress 페이지에 붙여 넣습니다). 비 ASCII 기호가 있습니다. HTML 소스에서 사용할 수있는 심볼로 안전하게 변환하려면 어떻게해야합니까? 현재 나는 모든 것을 유니 코드로 변환하고 파이썬 문자열로 모두 결합 한 다음 다음을 수행합니다. import codecs f = codecs.open('out.txt', mode="w", encoding="iso-8859-1") f.write(all_html.encode("iso-8859-1", "replace")) 마지막 …

18
Bash에서 4 자리 유니 코드 문자를 어떻게 에코합니까?
쉘 프롬프트 (특히 'SKULL AND CROSSBONES'(U + 2620))에 유니 코드 스컬과 크로스 본을 추가하고 싶지만, 에코 침을 뱉어내는 마법의 마법을 알아낼 수는 없습니다. 4 자리 유니 코드 문자 두 자리 숫자는 쉽습니다. 예를 들어 echo -e "\ x55",입니다. 아래의 답변 외에도 터미널은 출력이 예상 한대로 유니 코드를 지원해야한다는 점에 유의해야합니다. …



10
"for line in…"은 UnicodeDecodeError를 발생시킵니다 : 'utf-8'코덱이 바이트를 디코딩 할 수 없습니다
여기 내 코드가 있습니다. for line in open('u.item'): #read each line 이 코드를 실행할 때마다 다음 오류가 발생합니다. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte 이 문제를 해결하고 open ()에 추가 매개 변수를 추가하려고했습니다. 코드는 다음과 같습니다. for line in open('u.item', encoding='utf-8'): #read each …

6
문자셋 이름이 상수가 아닌 이유는 무엇입니까?
문자셋 문제는 그 자체로 혼란스럽고 복잡하지만 그 위에 문자셋의 정확한 이름을 기억해야합니다. 그렇 "utf8"습니까? 아니면 "utf-8"? 아니면 "UTF-8"? 인터넷에서 코드 샘플을 검색하면 위의 모든 내용이 표시됩니다. 상수로 명명하고 사용하는 것이 Charset.UTF8어떻습니까?

16
'&'를 '& amp;'로 인코딩해야합니까?
&내 사이트에서 HTML5 및 UTF-8과 함께 ' '기호를 사용하고 있습니다 <title>. Google은 제목의 모든 브라우저와 마찬가지로 SERP에 앰퍼샌드를 표시합니다. http://validator.w3.org 가 나에게 이것을주고 있습니다 : & 문자 참조를 시작하지 않았습니다. (그리고 아마도로 탈출했을 것 &입니다.) 정말로해야합니까 &? 유효성 검사를 위해 유효성을 검사하는 내 페이지에 대해 소란스럽지 않지만 이것에 대한 사람들의 …

12
UTF-8을 올바르게 인코딩하지 않는 PHP DOMDocument loadHTML
DOMDocument를 사용하여 일부 HTML을 구문 분석하려고하지만 그렇게하면 갑자기 인코딩이 손실됩니다 (적어도 그것이 나에게 나타나는 방식입니다). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } 이 코드의 결과는 일본어가 아닌 많은 문자를 얻는 것입니다. 그러나 내가 할 경우 : …

6
인코딩 / 디코딩의 차이점은 무엇입니까?
str / unicode 디코딩과 인코딩의 차이점을 이해하지 못했습니다. 나는 str().decode()당신이 알고있는 바이트 문자열이있을 때 특정 문자 인코딩을 가지고 있고, 인코딩 이름이 유니 코드 문자열을 반환한다는 것을 알고 있습니다. unicode().encode()주어진 인코딩 이름에 따라 유니 코드 문자를 바이트 문자열로 변환 한다는 것을 알고 있습니다. 그러나 나는 무엇 str().encode()이고 무엇인지 이해하지 못합니다 unicode().decode(). …

11
Python에서 오류없이 유니 코드를 ASCII로 변환
내 코드는 웹 페이지를 긁은 다음 유니 코드로 변환합니다. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) 그러나 나는 얻는다 UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in …

4
@charset“UTF-8”을 지정해야하는 이유; CSS 파일에?
나는이 지시를 내게 넘겨진 수많은 CSS 파일의 첫 번째 줄로 보았습니다. @charset "UTF-8"; 그것은 무엇을하며,이 규칙이 필요합니까? 또한이 메타 태그를 "head"요소에 포함 시키면 CSS 파일에도이 메타 태그가 없어도됩니까? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

11
인코딩과 문자셋의 차이점은 무엇입니까?
텍스트 인코딩과 문자 세트가 혼란 스럽습니다. 여러 가지 이유로, 나는 다가오는 작업에서 비 유니 코드, 비 UTF8을 배워야합니다. "ISO-2022-JP"에서와 같이 이메일 헤더에 "charset"이라는 단어가 있지만 텍스트 편집기에는 그러한 인코딩이 없습니다. (다른 텍스트 편집기를 둘러 보았습니다.) 텍스트 인코딩과 문자셋의 차이점은 무엇입니까? 유스 케이스 예제를 보여 주시면 감사하겠습니다.

11
PHP : 원래 문자 집합을 몰라도 문자열을 UTF-8로 변환하거나 최소한 시도
전 세계의 클라이언트를 다루는 응용 프로그램이 있으며 데이터베이스에 들어가는 모든 것이 UTF-8로 인코딩되기를 원합니다. 나에게 가장 큰 문제는 문자열의 소스가 어떤 인코딩인지 알지 못한다는 것입니다-텍스트 상자에서 ( <form accept-charset="utf-8">사용자가 실제로 양식을 제출 한 경우에만 유용합니다) 또는 업로드 된 텍스트 파일에서 입력을 제어 할 수 없습니다. 필요한 것은 내 데이터베이스에 들어가는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.