«character-encoding» 태그된 질문

2
파일 인코딩을 감지하는 방법?
내 파일 시스템 (Windows 7)에 텍스트 파일이 있습니다 (중요한 경우 SQL 스크립트 파일입니다). Notepad ++로 열면 "인코딩"메뉴에서 일부는 "UCS-2 Little Endian"으로 인코딩되고 일부는 "UTF-8없는 BOM"으로 인코딩됩니다. 차이점은 무엇입니까? 그것들은 모두 완벽하게 유효한 스크립트 인 것 같습니다. 메모장 ++없이 파일에 어떤 인코딩이 있는지 어떻게 알 수 있습니까?

5
UTF-8보다 ASCII 인코딩을 선택하면 어떤 이점이 있습니까?
ASCII의 모든 문자는 스토리지를 늘리지 않고도 UTF-8을 사용하여 인코딩 할 수 있습니다 (둘 다 스토리지 바이트 필요). UTF-8은 "ASCII-characters"이외의 문자 지원 이점을 제공합니다. 그런 경우에는, 우리는 왜 것 이제까지 UTF-8을 통해 ASCII 인코딩을 선택 하는가? UTF-8 대신 ASCII를 선택할 때 유스 케이스가 있습니까?

2
왜 그렇게 많은 해시 및 암호화 된 문자열이 등호로 끝나는가?
나는 C # 및 MSSQL에서 일하고 있으며 소금에 절인 해시 된 암호를 저장할 것으로 예상합니다. nvarchar 열에 저장된 해시를 볼 때 (예 : outp 상자 aspnet 멤버 자격 공급자). 생성 된 Salt 및 Hash 값이 항상 하나 또는 두 개의 등호로 끝나는 이유가 항상 궁금합니다. 암호화 알고리즘을 사용하는 동안 비슷한 …

3
왜 Microsoft SQL Server에서 문자열 앞에 N을 넣어야합니까?
T-SQL을 배우고 있습니다. 내가 본 예제에서 varchar()셀에 텍스트를 삽입하기 위해 삽입 할 문자열 만 쓸 수 있지만 nvarchar()셀의 경우 모든 예제에는 문자열 앞에 문자 N이 붙습니다. nvarchar()행 이있는 테이블에서 다음 쿼리를 시도했지만 제대로 작동하므로 접두사 N이 필요하지 않습니다. insert into [TableName] values ('Hello', 'World') 내가 본 모든 예제에서 문자열 앞에 …

8
UTF-8 이외의 문자 인코딩 (및 UTF-16 / UTF-32)은 더 이상 사용되지 않습니까?
내 애완 동물은 문자 세트 지원을위한 코드가 많은 소프트웨어 프로젝트를보고 있습니다. 내가 틀리지 말고, 나는 호환성을 위해 모두 노력하고 있으며, 텍스트 편집기를 사용하여 파일을 여러 문자 세트로 열고 저장할 수있어서 기쁩니다 . 나를 괴롭히는 것은 비 유니버설 문자 인코딩의 확산이“문제”가 아닌“적절한 유니 코드 지원”으로 분류되는 방법입니다. 예를 들어 PostgreSQL과 해당 …

7
캐리지 리턴 숯은 쓸모없는 것으로 간주됩니다
구조화 된 데이터를 구문 분석하지만 요점을 보지 못했기 때문에 의도적으로 캐리지 리턴 감지를 생략하는 오픈 소스 라이브러리를 작성했습니다. 이점이 거의없는 추가적인 복잡성과 오버 헤드를 추가합니다. 놀랍게도 사용자는 파서가 작동하지 않는 버그를 제출했으며 문제의 원인은 데이터가 LF 또는 CRLF가 아닌 CR 줄 끝을 사용했다는 것을 발견했습니다. OSX는 유닉스 기반 플랫폼으로 전환 …

5
사람들이 유니 코드가 아닌 일본어 전용 인코딩을 사용하게하는 문제는 무엇입니까?
직장에서 Shift-JIS 및 기타 인코딩으로 많은 일본어 텍스트 파일을 발견했습니다. 모든 컴퓨터 사용자에게 여러 가지 모모 베이크 (판독 불가 문자) 문제가 발생합니다. 유니 코드는 모든 언어에 대해 단일 문자 집합을 정의하여 이러한 종류의 문제를 해결하기위한 것이며 UTF-8 직렬화는 인터넷에서 사용하는 것이 좋습니다. 그렇다면 왜 모두가 일본어 전용 인코딩에서 UTF-8로 전환하지 …


2
UTF-16은 고정 너비 또는 가변 너비입니까? UTF-8에 바이트 순서 문제가없는 이유는 무엇입니까?
UTF-16은 고정 너비 또는 가변 너비입니까? 다른 출처에서 다른 결과를 얻었습니다. 에서 http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16은 유니 코드 문자를 16 비트 청크로 저장합니다. 에서 http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16 비트 유니 코드 변환 형식)은 유니 코드 코드 공간에서 0에서 0x10FFFF까지 1,112,064 [1] 숫자 (코드 포인트)를 인코딩 할 수있는 유니 코드 용 문자 …

3
소스 코드가 UTF-8이어야합니까?
나는 종종 코드의 형식을 실제로 선택하지 않는다고 생각합니다. 과거의 대부분의 도구가 나를 위해 결정했습니다. 또는 나는 그것에 대해 생각조차하지 않았습니다. 나는 다른 날에 Windows에서 TextPad를 사용하고 있었고 파일을 저장할 때 ASCII, UTF-8 / 16, Unicode 등을 묻습니다. 작성된 거의 모든 코드가 ASCII라고 가정하지만 왜 ASCII 여야합니까? 실제로 소스 코드에 UTF-8 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.