«unicode» 태그된 질문

유니 코드는 세계 대부분의 필기 시스템에서 표현 된 텍스트의 일관된 인코딩, 표현 및 처리를위한 컴퓨팅 산업 표준입니다.

6
그놈 터미널 프로파일이 기본적으로 UTF-8을 사용할 수 있습니까?
우분투 시스템에 있습니다. 내가 없는 내가 로케일을 변경할 수 있도록 루트가있다. 기본 터미널 프로필이 기본적으로 UTF-8을 사용하도록하고 싶습니다. .gconf/apps/gnome-terminal/디렉토리 어딘가 또는 환경 변수 등에서 이를 수행 할 수있는 방법이 있어야합니다 . 그러나 나는 그것을 찾을 수없는 것 같습니다. 자세한 내용으로 편집하십시오. 터미널에는 다음이 있습니다. grid-unv55$ locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" …

3
유니 코드 문자를 작성하는 보편적 인 방법이 있습니까?
vim, Chrome (지금처럼!) 또는 LibreOffice와 같은 다양한 프로그램에서 em 대시 (—)와 같은 특수 유니 코드 문자를 쓰고 싶을 때가 있습니다. LibreOffice에서는 삽입 메뉴에있는 전용 대화 상자를 통해이 작업을 수행 할 수 있습니다. 다른 프로그램에는 기본 제공 방식이없는 것 같습니다. 이 경우 나의 해결책은 Wikipedia에서 캐릭터를 찾아서 복사하여 붙여 넣는 것입니다. …


6
히브리 이름을 가진 파일의 ZIP 아카이브를 올바르게 압축 해제하려면 어떻게해야합니까?
누군가 히브리어 이름을 가진 파일이 들어있는 ZIP 파일을 보냈습니다 (그리고 어떤 도구로 확실하지 않은 경우 Windows에서 생성). 데비안 스트레치에서 LXDE를 사용합니다. Gnome 아카이브 관리자는 파일의 압축을 풀지 만 히브리어 문자는 깨집니다. 나는 생각 나는 이름이 네 문자와 .DOC의 suffic을 가진 파일을 예를 들어 I, 유니 코드 문자로 확장 UTF-8 옥텟을 …

2
일부 유니 코드 문자가 터미널에 인쇄되지 않는 이유는 무엇입니까?
Adobe Source Code Pro 글꼴을 사용하여 간단한 터미널로 Arch Linux를 실행하고 있습니다. 내 로케일이로 설정되었습니다 LANG=en_US.UTF-8. 카드 놀이를 나타내는 유니 코드 문자를 터미널에 인쇄하고 싶습니다. 참조 용으로 Wikipedia를 사용하고 있습니다. 카드 한 벌의 유니 코드 문자가 제대로 작동합니다. 예를 들어, 발행 $ printf "\u2660" 화면에 검은 마음을 인쇄합니다. 그러나 특정 …
16 bash  fonts  unicode  printf 


3
U + xxxxx 코드로 지정된 이모티콘을 utf-8로 변환하는 방법은 무엇입니까?
이모티콘은 U + xxxxx 형식을 사용하여 지정된 것 같습니다. 여기서 각 x는 16 진수입니다. 예를 들어 U + 1F615 는 "혼란 된 얼굴"에 대한 공식 유니 코드 컨소시엄 코드 입니다. 나는 종종 혼란스러워서이 상징에 대해 강한 친근감을 가지고 있습니다. U + 1F615 I 유니 코드 문자 만 가능한 인코딩은 8, …

2
utf를 알고있는 coreutils?
cut오늘 사용했을 때 UTF-8 문자를 문자로 취급하지 않고 3 바이트 길이이므로 3 문자로 취급한다는 것을 알았습니다. 이것은 많은 도구에서 일반적으로 적용되는 것 같습니다. coreutilsUTF-8을 인식하는 버전이 있습니까? 내 locale출력 : LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_PAPER="en_US.UTF-8" LC_NAME="en_US.UTF-8" LC_ADDRESS="en_US.UTF-8" LC_TELEPHONE="en_US.UTF-8" LC_MEASUREMENT="en_US.UTF-8" LC_IDENTIFICATION="en_US.UTF-8" LC_ALL= cut작동하지 않을 때 echo 哈哈 | …
16 unicode  coreutils  cut 

4
코드 포인트 렌더링에 가장 적합한 글꼴 찾기
유니 코드 코드 포인트 렌더링에 적합한 글꼴을 찾는 방법은 무엇입니까? gnome-terminal«🉃 ⼼ 😻🕲🝤»와 같은 문자는 내 터미널 글꼴이나 코드 포인트 인 스퀘어 폴백 (????) 대신 Symbola와 같은 글꼴로 렌더링 될 수 있습니다. 어떻게 ?
16 fonts  unicode 

3
UTF-8에서`cut -c` (`--characters)를 사용할 수 없습니까?
이 명령 cut에는 옵션이있는 -c바이트 대신 문자를 처리하는 옵션이 -b있습니다. 그러나 en_US.UTF-8로케일 에서는 작동하지 않는 것 같습니다 . 두 번째 바이트는 두 번째 ASCII 문자를 제공합니다 (UTF-8과 동일하게 인코딩 됨). $ printf 'ABC' | cut -b 2 B UTF-8 로켈에서 세 개의 그리스어 비 ASCII 문자 중 두 번째를 제공하지 …

5
문자열의 표시 너비를 가져옵니다.
쉘 스크립트에서 문자열의 디스플레이 너비 (최소한 현재 로케일의 문자를 올바른 너비로 표시하는 터미널)에서 가장 쉬운 방법은 무엇입니까? 나는 주로 비 제어 문자의 너비에 관심이 있지만 백 스페이스, 캐리지 리턴, 가로 표와 같은 제어 문자를 고려한 솔루션도 환영합니다. 즉, POSIX 함수를 중심 으로 쉘 API를 찾고 wcswidth()있습니다. 이 명령은 다음을 반환해야합니다. …

2
UTF 8 파일 이름?
유닉스 기반 운영 체제에서 utf6 파일 이름은 허용됩니까? 그렇다면 파일을 디스크에 쓰려면 특별한 작업을 수행해야합니다. 내가하고 싶은 일을 설명하겠습니다. ftp를 통해 파일을 원격 시스템으로 전송하는 응용 프로그램을 작성하고 있지만 파일 이름은 utf8에있을 수있는 메타 데이터 집합을 통해 동적으로 설정됩니다. 유닉스 / 리눅스에서 디스크에 파일을 작성하기 위해해야 ​​할 일이 있는지 궁금합니다. …

2
grep : 일본어 한자가 포함 된 모든 줄 찾기
거대한 UTF-8 텍스트 파일에서 일본어 한자 가 포함 된 모든 줄을 표시하고 싶습니다 . 이것은 어떤 grep(또는 다른) 표현입니까? 내가 실수하지 않으면 간지가 \u4e00와 사이의 문자 \u4dbf입니다. 나는 kanas 를 보여줄 필요는 없지만 , 그것들을 보여주는 것도 큰 문제는 아닙니다.
14 grep  unicode 

1
Gnome 데스크탑에서 KDE의 Konsole 터미널에 유니 코드 문자를 입력하려면 어떻게해야합니까?
Ubuntu를 사용합니다. 'gnome-terminal'에서 먼저 Ctrl-Shift-u를 입력 한 다음 Codepoint hex 값을 입력하여 Unicode Codepoints를 입력 할 수 있습니다. C-S-u 2468⑨ 생산 konsole내가 선호하는 터미널에는이 CSu (그놈) 기능이 없습니다. Konsole에서 이것을 수행하는 동등한 KDE 방법이 있습니까?

2
iconv 잘못된 입력 순서-왜?
텍스트 파일을 ASCII 파일로 변환하려고 할 때 오류 메시지가 나타납니다 iconv: illegal input sequence at position. 내가 사용하는 명령은 iconv -f UTF-8 -t ascii//TRANSLIT file 문제가되는 캐릭터는 æ입니다. 텍스트 파일 자체가 여기에 있습니다 . 왜 잘못된 순서라고 말합니까? 입력 문자는 올바른 UTF-8 문자 (U + 00E6)입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.