«character-encoding» 태그된 질문

ASCII, UTF-8, EBCDIC 등과 같은 문자 및 문자 세트의 다양한 표현을 다루는 질문. 캐리지 리턴 및 / 또는 줄 바꾸기 문자를 사용하여 줄 바꾸기를 인코딩하는 운영 체제간에 파일을 이동할 때 종종 발생합니다.

2
VIM의 기본 인코딩을 UTF-8로 설정하려면 어떻게해야합니까?
번역 된 문자열을 제공하는 오픈 소스 프로젝트에 기여하고 싶습니다. 요구 사항 중 하나는 제공자가 PO 파일의 인코딩으로 UTF-8을 사용해야한다는 것입니다. Linux에서 VIM 7.3을 사용하고 있습니다. .po 파일을 올바르게 편집하고 저장할 수 있도록 VIM의 인코딩이 UTF-8로 설정되어 있는지 어떻게 확인할 수 있습니까?

6
잘못된 utf8 필터링
알 수 없거나 혼합 된 인코딩의 텍스트 파일이 있습니다. UTF-8이 아닌 바이트 시퀀스를 포함하는 줄을보고 싶습니다 (텍스트 파일을 일부 프로그램으로 파이핑하여). 마찬가지로, 유효한 UTF-8 행을 필터링하고 싶습니다. 즉, 찾고 있습니다 .grep [notutf8] 이상적인 솔루션은 이식 가능하고 짧고 다른 인코딩에 일반화 할 수 있지만 UTF-8 정의 에서 굽는 것이 가장 좋은 …

4
^ M 문자는 무엇입니까?
TexPad가 만들고 있습니다. 나는 그것이 데드 키 아래에 있다는 것을 알고 있습니다. 나는 그것이 이름이라는 것을 기억할 수 없다. 파란색 문자 : 문서에서 대량으로 제거하고 싶습니다. 어떻게 입력 할 수 있습니까?

3
텍스트 파일의 인코딩을 테스트하려면 어떻게해야합니까 ... 유효하고 무엇입니까?
경고 / 오류없이 Gedit.htm 에서 여는 여러 파일이 있지만에서 동일한 파일을 열면 잘못된 UTF-8 인코딩에 대해 경고합니다 ...Jedit HTML 메타 태그에는 "charset = ISO-8859-1"이 표시됩니다. JEDIT은 허용 대체 인코딩 목록 과 자동 감지기 인코딩 목록 내 즉각적인 문제가 해결 될 수 있도록, (현재는 "BOM의 XML-PI를"). 그러나 이것은 나를 생각하게했습니다 : …

4
바이트를 파일로 에코
i2c 버스를 사용하여 rasberry Pi를 일부 디스플레이에 연결하려고합니다. 시작하려면 물건, 특히 파일에 바이트를 수동으로 작성하고 싶었습니다. 파일에 특정 바이트를 어떻게 쓰나요? 나는 이미 그 것을 읽었고 내 문제가 다음과 같이 해결되어야한다고 생각했다. echo -n -e \x66\x6f\x6f > byteFileForNow 그러나 foo 대신 nano로 해당 파일을 열면 다음과 같이 표시됩니다. x66x6fx6f 따라서 …

3
Linux에서 파일 이름 및 경로에 사용되는 문자셋 인코딩은 무엇입니까?
사용하는 파일 시스템에 따라 달라 집니까? 예를 들어, ext2 / ext3 / ext4뿐만 아니라 ISO 9660과 함께 "joliet"CD-ROM 중 하나를 삽입하면 어떻게됩니까? POSIX에 파일 이름의 문자셋 인코딩에 대한 일종의 사양이 포함되어 있다고 들었습니다. 본질적으로 UTF-8로 인코딩 된 파일 이름을 얻었는지 궁금한 점은 Linux의 파일 I / O API에 전달하기 전에 …

2
find (1) : 일부 파일 이름에서 스타 와일드 카드가 어떻게 실패하도록 구현 되었습니까?
파일 이름이 UTF-8 인 파일 시스템에는 이름이 잘못된 파일이 있습니다. 그것은으로 표시됩니다 D�sinstaller, 실제 이름을 zsh을 따라 : D$'\351'sinstaller, 라틴를위한 Désinstaller자체에 대한 프랑스의야만 "제거." Zsh는 일치하지 [[ $file =~ '^.*$' ]]않지만 globbing과 일치합니다. 이것은 *내가 예상하는 동작입니다. 이제는 실행할 때 find . -name '*'파일 이름을 찾을 것으로 예상합니다. 실제로 파일 …

4
`grep`에서 16 진 코드를 사용하여 문자를 지정하는 방법은 무엇입니까?
다음 명령을 사용하여 16 진수 코드 0900 (अ 대신)에서 097F (व 대신)로 문자 세트 범위를 grep하고 있습니다. अ와 व 대신 16 진수 코드를 사용하려면 어떻게해야합니까? bzcat archive.bz2 | grep -v '<[अ-व]*\s' | tr '[:punct:][:blank:][:digit:]' '\n' | uniq | grep -o '^[अ-व]*$' | sort -f | uniq -c | sort -nr …

3
유닉스 파일 이름 인코딩 이해
파일 이름 인코딩이 어떻게 작동하는지 이해하기가 어렵습니다. 유닉스 SE에서 모순되는 설명을 발견했습니다. 파일 이름은 문자로 저장됩니다 다른 대답을 인용하려면 : Linux의 파일 시스템 문자 인코딩에 대한 몇 가지 질문 […] 질문에서 언급했듯이 UNIX 파일 이름은 일련의 문자 일뿐입니다. 커널은 인코딩에 대해 전혀 알지 못하며 이는 완전히 사용자 공간 개념입니다. 파일 …

5
Chrome에서 일부 문자가 사각형으로 표시되는 이유는 무엇입니까?
예를 들어 dev 도구에서 다음과 같은 것을 얻습니다. 이 사각형 중 일부는 줄의 끝에 있습니다. 처음에는 캐리지 리턴이라고 생각했지만 그렇지 않습니다. 또한, 사각형 뒤에 표시 =또는 >이 더 줄 바꿈없고, 16 진수 편집기 프로그램에서 파일을보고 어디 사이의 모든에서 모든 문자가 아니라는 것을 많은 곳에서 =하고 "(예 id="로서 보여주고있다 id=? ") …

2
tr은 "잘못된 바이트 시퀀스"에 대해 불평합니다
저는 유닉스를 처음 접했고 Kirk McElhearn의 "Mac OS X Command Line"을 사용하여 몇 가지 명령을 가르쳐 왔습니다. 내가 사용하려고 시도하고 tr하고 grep그래서 나는 정기적으로 MS 오피스 워드 문서에서 텍스트 문자열을 검색 할 수 있습니다. $ tr '\r' '\n' < target-file | grep search-string 그러나 반환되는 것은 다음과 같습니다. Illegal byte …

4
파일 이름에 ASCII가 아니거나 인쇄 할 수없는 문자가있는 파일을 식별하십시오.
약 70 만 개의 파일이있는 디렉토리 크기 80GB의 경우 파일 이름에 영어 이외의 문자가 포함 된 일부 파일 이름이 있습니다. 파일 목록을 트롤링하는 것 외에는 다음과 같은 것이 있습니다. 이러한 파일 이름을 나열하거나 식별하는 쉬운 방법은 무엇입니까? 인쇄 가능한 영어 이외의 문자를 생성하는 방법-인쇄 가능한 범위에 나열되지 않은 문자 man …


5
UTF-8 파일을 ASCII로 변환 (최선의 노력)
여러 언어로 된 텍스트를 포함하는 UTF-8 파일이 있습니다. 그것은 많은 사람들의 이름입니다. ASCII로 변환해야하고 가능한 한 괜찮은 결과가 필요합니다. 더 넓은 인코딩에서 더 좁은 인코딩으로 변환하는 방법에는 여러 가지가 있습니다. 가장 간단한 변형은 모든 비 ASCII 문자를 '_'와 같은 자리 표시 자로 바꾸는 것입니다. 파일이 작성된 언어를 알고 있다면 로마자 …

6
임의의 비밀번호 생성 왜 휴대용이 아닌가?
임의의 비밀번호를 생성하고 싶습니다. </dev/urandom tr -dc [:print:] | head -c 64 Ubuntu를 실행하는 랩톱에서는 의도 한대로 인쇄 가능한 문자 만 생성합니다. 그러나 Red Hat Enterprise Linux를 실행하는 학교 서버에 ssh를 넣고 실행하면, 같은 결과를 얻지 3!ri�b�GrӴ��1�H�<�oM����&�nMC[�Pb�|L%MP�����9��fL2q���IFmsd|l�K못합니다. 여기서 무엇이 잘못 될 수 있습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.