"right to left"또는 "zero width non-joiner"와 같이 보이지 않는 제어 문자가 많은 파일, 일반 공간과 다른 공간 등을 처리해야하며,이를 처리하는 데 문제가 있습니다.
이제는 주어진 파일의 모든 문자를 문자별로 보았습니다 ( "왼쪽에서 오른쪽으로 말하고 싶습니다. 그러나 불행히도 오른쪽에서 왼쪽으로 쓰는 언어를 다루고 있습니다") , 유니 코드 코드 포인트 만 사용하여 기본 bash 도구 (예 vi
: less
,, cat
...) 어떻게 든 가능합니까?
로 파일을 16 진수로 표시 할 수 있다는 것을 알고 hexdump
있지만 코드 포인트를 다시 계산해야합니다. 실제로 실제 유니 코드 코드 포인트를보고 싶기 때문에 Google에서 해당 코드 포인트를 확인하고 무슨 일이 일어나고 있는지 확인할 수 있습니다.
편집 : 나는 그것을 다른 인코딩으로 트랜스 코딩하고 싶지 않다고 덧붙일 것이다. UTF8로 된 파일이 있는데 괜찮습니다. 모든 문자의 정확한 코드 포인트를 알고 싶습니다.