cut
오늘 사용했을 때 UTF-8 문자를 문자로 취급하지 않고 3 바이트 길이이므로 3 문자로 취급한다는 것을 알았습니다.
이것은 많은 도구에서 일반적으로 적용되는 것 같습니다.
coreutils
UTF-8을 인식하는 버전이 있습니까?
내 locale
출력 :
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
cut
작동하지 않을 때
echo 哈哈 | cut -c 2-
��哈
올바른 출력은
哈
cut -c
멀티 바이트 문자로 작업 한 경우
로케일로 업데이트했습니다.
—
Chao Xu
자,
—
alex
cut
명령 행의 예를 추가 할 수 있습니까?
Ubuntu 10.04에서
—
maxschlepzig
echo ßßßß | cut -c 2-
-> �ßßß
( LANG=en_US.UTF-8
) 로이를 확인할 수 있습니다.
슬픈 것은 3 년 후에도 우분투 13.10에서도 여전히 그렇습니다.
—
Dr. Mike
locale
올바르게 설정 했습니까 ?locale
(인수가없는) 명령 호출 의 읽기는 무엇입니까 ?