답변:
에서 이것을 확인하는 좋은 방법을 bash
모르지만 Python에는 다음과 같은 스크립트에서 사용할 수있는 내장 유니 코드 데이터베이스가 있습니다.
#!/usr/bin/env python
import sys, unicodedata
for ch in sys.stdin.read().decode('utf-8'):
try:
print unicodedata.name(ch)
except ValueError:
print 'codepoint ', ord(ch)
이 스크립트를 다음과 같이 사용할 수 있습니다 (호출했다고 가정 unicode-names
).
$ echo 'abc©áοπρσ' | unicode-names
LATIN SMALL LETTER A
LATIN SMALL LETTER B
LATIN SMALL LETTER C
COPYRIGHT SIGN
LATIN SMALL LETTER A WITH ACUTE
GREEK SMALL LETTER OMICRON
GREEK SMALL LETTER PI
GREEK SMALL LETTER RHO
GREEK SMALL LETTER SIGMA
codepoint 10
데이터베이스는 ValueError
모르는 문자에 대해 예외를 발생 시키므로 코드 포인트를 10 진수로 인쇄합니다 (일반적으로 인쇄 할 수없는 문자 임).
주의 사항 : 스크립트는 터미널이 UTF-8로 인코딩 된 것으로 가정합니다. 그렇지 않은 경우 decode()
메소드 의 인수를 변경해야합니다 . 파이썬은 매우 다양한 인코딩을 지원합니다.
sys.getdefaultencoding()
.
echo -n …— | uniname -bcegpu