리눅스에는 파일이 많은 디렉토리가 있습니다. 그들 중 일부는 비 ASCII 문자를 가지고 있지만 모두 유효한 UTF-8 입니다. 하나의 프로그램에는 ASCII가 아닌 파일 이름으로 작업하는 것을 방해하는 버그가 있으며 영향을받는 파일 수를 알아야합니다. 이 작업 find
을 수행 한 다음 grep 을 수행 하여 비 ASCII 문자를 인쇄 한 다음 wc -l
숫자를 찾으려고합니다. grep 일 필요는 없습니다. Perl , sed , AWK 등과 같은 표준 Unix 정규식을 사용할 수 있습니다 .
그러나 'ASCII 문자가 아닌 문자'에 대한 정규식이 있습니까?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]