2958616 바이트 텍스트 파일이 있습니다. 을 실행 sort < file.txt | uniq > sorted-file.txt
하면 3213965 바이트 텍스트 파일이 생성됩니다. 정렬 된 텍스트 파일이 더 큰 이유는 무엇입니까?
여기 에서 텍스트 파일을 다운로드 할 수 있습니다 .
@meuh 그게 다야! 답변으로 추가해 주시겠습니까?
—
wb9688
잠깐, 로케일 이 이것에 영향을 줍니까? 어떤 로케일을 사용하고 있습니까? 출력은
—
terdon
locale
무엇입니까? 다른 시스템에서 파일을 작성하지 않았습니까?
sed '/^[a-z]*$/d' < file.txt | wc -l
나에게 305 줄을 주었다.
파일
—
terdon
â ê î ñ ô ö öö û
에 ASCII 세트에없는 파일도 포함되어 있습니다 .
\r\n
줄 끝이 있고 입력 파일에는\n
줄 끝이 있습니다. 아마도 로케일을 다르게 설정해야합니다.LC_ALL=C
각 명령 앞에서 시도하십시오 .