다음 명령을 사용하여 16 진수 코드 0900 (अ 대신)에서 097F (व 대신)로 문자 세트 범위를 grep하고 있습니다. अ와 व 대신 16 진수 코드를 사용하려면 어떻게해야합니까?
bzcat archive.bz2 | grep -v '<[अ-व]*\s' | tr '[:punct:][:blank:][:digit:]' '\n' | uniq | grep -o '^[अ-व]*$' | sort -f | uniq -c | sort -nr | head -50000 | awk '{print "<w f=\""$1"\">"$2"</w>"}' > hindi.xml
다음과 같은 결과가 나타납니다.
<w f="399651">और</w>
<w f="264423">एक</w>
<w f="213707">पर</w>
<w f="74728">कर</w>
<w f="44281">तक</w>
<w f="35125">कई</w>
<w f="26628">द</w>
<w f="23981">इन</w>
<w f="22861">जब</w>
...
위의 명령에서 अ 및 व 대신 16 진수 코드를 사용하고 싶습니다.
16 진 코드를 사용할 수 없다면 16 진수 코드 대신 유니 코드를 문자 집합 ( 'अ-व')에 사용할 수 있습니까?
우분투 10.04를 사용하고 있습니다
-v
당신의 질문 텍스트에서 당신이 원하는 것이 아닌 것처럼 일치를 반전시킵니다.