«character-encoding» 태그된 질문

문자 인코딩은 문자가 일련의 바이트로 표시되는 방식을 나타냅니다. 웹의 문자 인코딩은 인코딩 표준에 정의되어 있습니다.


6
ASCII 코드는 7 비트입니까, 8 비트입니까?
선생님은 ASCII가 8 비트 문자 코딩 체계라고 말씀하셨습니다. 그러나 0-127 코드에 대해서만 정의되므로 7 비트에 맞을 수 있습니다. 그렇다면 ASCII 비트가 실제로 7 비트 코드라고 주장 할 수 없습니까? 그리고 ASCII가 8 비트 코드라고 말할 때 우리는 무엇을 의미합니까?

7
MacRoman, CP1252, Latin1, UTF-8 및 ASCII 간의 인코딩을 안정적으로 추측하는 방법
직장에서 인코딩 관련 연결, 재난 또는 재앙 없이는 일주일이 지나지 않는 것처럼 보입니다. 문제는 일반적으로 인코딩을 지정하지 않고도 "텍스트"파일을 안정적으로 처리 할 수 ​​있다고 생각하는 프로그래머에게서 발생합니다. 그러나 당신은 할 수 없습니다. 따라서 이후에는 파일 이름이 *.txt또는로 끝나는 것을 금지하기로 결정되었습니다 *.text. 이러한 확장은 평범한 프로그래머를 인코딩과 관련하여 지루한 안주로 …

3
"& # 160;" "& nbsp;"의 대체?
내 ASP.NET 응용 프로그램에서 스페이스 바를 입력하여 두 텍스트 상자 사이에 공백을 몇 개 추가하려고했습니다. 등가 HTML 소스였다  대신  . 그래서 확인하고 싶었습니다. 이것이 공백의 새로운 대체물입니까? 그렇다면 왜 변경되었는지 알 수 있습니까?


2
문자에는 몇 비트 또는 바이트가 있습니까? [닫은]
여기서 무엇을 요청하는지 말하기는 어렵습니다. 이 질문은 모호하고, 모호하며, 불완전하고, 지나치게 광범위하거나, 수사적이며 현재 형식으로는 합리적으로 대답 할 수 없습니다. 이 질문을 다시 열 수 있도록 설명 하는 데 도움이 필요하면 도움말 센터를 방문하세요 . 휴일 9 년 ago . "문자"당 얼마나 많은 비트 또는 바이트가 있습니까?

10
"java.nio.charset.MalformedInputException : Input length = 1"을 피하기위한 모든 포함 문자셋?
디렉토리의 텍스트 기반 파일을 읽는 Java로 간단한 wordcount 프로그램을 만들고 있습니다. 그러나 계속 오류가 발생합니다. java.nio.charset.MalformedInputException: Input length = 1 이 코드 줄에서 : BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Charset텍스트 파일에 일부 문자가 포함되지 않은 a 를 사용했기 때문에이 메시지를 얻을 수 있으며 일부는 다른 언어의 문자를 포함합니다. 하지만 그 캐릭터를 …

3
JsonParseException : 인용되지 않은 잘못된 문자 ((CTRL-CHAR, 코드 10)
org.apache.httpcomponentsJSON 형식 데이터를 API에 게시하는 Rest API 를 사용하려고합니다 . 이 예외가 발생합니다. 원인 : com.fasterxml.jackson.core.JsonParseException : 따옴표없는 잘못된 문자 ((CTRL-CHAR, 코드 10)) : 문자열에 포함 되려면 백 슬래시를 사용하여 이스케이프해야합니다. 그 이유는 ctrl-charJSON 문자열에이 포함되어 있기 때문 입니다. 이 솔루션이나 다른 솔루션을 대체 할 방법이 있습니까?

9
Python으로 UTF8 CSV 파일 읽기
Python으로 악센트 부호가있는 문자가있는 CSV 파일을 읽으려고합니다 (프랑스어 및 / 또는 스페인어 문자 만 해당). csvreader에 대한 Python 2.5 문서 ( http://docs.python.org/library/csv.html ) 를 기반으로 csvreader가 ASCII 만 지원하므로 CSV 파일을 읽기 위해 다음 코드를 작성했습니다. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily as UTF-8: csv_reader …

6
Java에서 기본 문자 세트 / 인코딩을 찾는 방법은 무엇입니까?
분명한 대답은 사용하는 Charset.defaultCharset()것이지만 최근에 이것이 정답이 아닐 수 있음을 발견했습니다. 결과가 java.io 클래스에서 사용하는 실제 기본 문자 집합과 여러 번 다르다고 들었습니다. Java가 2 세트의 기본 문자 세트를 유지하는 것처럼 보입니다. 누구든지이 문제에 대한 통찰력이 있습니까? 하나의 실패 사례를 재현 할 수있었습니다. 일종의 사용자 오류이지만 다른 모든 문제의 근본 …

6
Windows 10 명령 프롬프트에서 git 로그 출력 인코딩 문제
문제 git logWindows 명령 프롬프트에 명령 출력을 올바르게 표시 하는 방법은 무엇입니까? 예 보시다시피 분음 부호 문자를 올바르게 입력 할 수 있지만 git log출력에서 어떻게 든 이스케이프됩니다. UTF-8인코딩 테이블 에 따르면 출력에서 꺾쇠 괄호 ( <및 >) 사이의 코드 는 이전에 입력 한 git config매개 변수에 해당합니다 . 비슷한 문제에 …

5
Python : ISO-8859-1 / latin1에서 UTF-8로 변환
이메일 모듈을 사용하여 Quoted-printable에서 ISO-8859-1로 디코딩 된이 문자열이 있습니다. 이것은 "Äpple"(스웨덴어로 Apple)에 해당하는 "\ xC4pple"과 같은 문자열을 제공합니다. 그러나 해당 문자열을 UTF-8로 변환 할 수 없습니다. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't …



7
바이트 배열을 문자열로 변환 (Java)
Google App Engine에서 웹 애플리케이션을 작성 중입니다. 기본적으로 .htmlblobstore에 파일로 저장되는 html 코드를 편집 할 수 있습니다 . fetchData를 사용 byte[]하여 파일의 모든 문자 를 반환 합니다. 사용자가 html 코드를 편집 할 수 있도록 html로 인쇄하려고합니다. 모든 것이 잘 작동합니다! 지금 내 유일한 문제는 다음과 같습니다. 바이트 배열은 문자열로 다시 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.