«character-encoding» 태그된 질문

문자 인코딩은 문자가 일련의 바이트로 표시되는 방식을 나타냅니다. 웹의 문자 인코딩은 인코딩 표준에 정의되어 있습니다.

4
문자 인코딩 문제를 테스트하기위한 "Lorem ipsums"파일 세트가 있습니까?
레이아웃을 위해 유명한 "Lorem ipsum"텍스트가 어떻게 생겼는지 테스트합니다. 내가 찾고있는 것은 텍스트 파일을 읽을 때 문자 인코딩을 처리하는 일부 메소드를 테스트하기 위해 JUnit 테스트에서 사용할 수있는 여러 다른 인코딩으로 인코딩 된 텍스트를 포함하는 파일 세트입니다. 예: 갖는 ISO 8859-1인코딩 테스트 파일과 Windows-1252인코딩 테스트 파일을. Windows-1252는 지역 80 16 – 9F …

3
텍스트 파일에서 UTF-8이 아닌 문자를 제거하는 방법
utf-8로 인코딩 된 아랍어, 영어, 러시아어 파일이 많이 있습니다. Perl 스크립트를 사용하여 이러한 파일을 처리하려고하면 다음 오류가 발생합니다. Malformed UTF-8 character (fatal) 이 파일의 내용을 수동으로 확인한 결과 이상한 문자가 발견되었습니다. 이제 파일에서 이러한 문자를 자동으로 제거하는 방법을 찾고 있습니다. 어쨌든 그것을 할 수 있습니까?

8
C 프로그래밍 : 유니 코드 용으로 프로그래밍하는 방법?
엄격한 유니 코드 프로그래밍을 수행하려면 어떤 전제 조건이 필요합니까? 이 내 코드는 사용하지 말아야 것을 의미합니까 char어디서나 종류와 그 기능을 처리 할 수있는 사용해야 wint_t하고 wchar_t? 그리고이 시나리오에서 멀티 바이트 문자 시퀀스가 ​​수행하는 역할은 무엇입니까?

1
Python 디코딩 유니 코드는 지원되지 않습니다.
Python에서 인코딩에 문제가 있습니다. 다른 방법을 시도했지만 출력을 UTF-8로 인코딩하는 가장 좋은 방법을 찾지 못하는 것 같습니다. 이것이 내가하려는 것입니다. result = unicode(google.searchGoogle(param), "utf-8").encode("utf-8") searchGoogle에 대한 첫 번째 Google 결과를 반환합니다 param. 이것은 내가 얻는 오류입니다. exceptions.TypeError: decoding Unicode is not supported 이 오류를 피하기 위해 Python이 내 출력을 UTF-8로 …

3
자바 : 문자열과 ByteBuffer 간 변환 및 관련 문제
소켓 연결에 Java NIO를 사용하고 있으며 프로토콜은 텍스트 기반이므로 SocketChannel에 쓰기 전에 문자열을 ByteBuffer로 변환하고 들어오는 ByteBuffer를 다시 문자열로 변환 할 수 있어야합니다. 현재 다음 코드를 사용하고 있습니다. public static Charset charset = Charset.forName("UTF-8"); public static CharsetEncoder encoder = charset.newEncoder(); public static CharsetDecoder decoder = charset.newDecoder(); public static ByteBuffer str_to_bb(String …


18
FPDF utf-8 인코딩 (HOW-TO)
누구든지 FPDF 패키지의 인코딩을 utf-8로 설정하는 방법을 알고 있습니까? 아니면 그리스 문자를 지원하는 ISO-8859-7 (그리스어) 이상? 기본적으로 그리스 문자가 포함 된 pdf 파일을 만들고 싶습니다. 어떤 제안이라도 도움이 될 것입니다. 성 조지

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.