관련이 있지만 만족스러운 답변은 없습니다 . 큰 텍스트 파일을 500 단어 정도의 청크로 나눌 수 있습니까?
한 줄에 10 ^ 7 개 이상의 단어 가있는 텍스트 파일 ( http://mattmahoney.net/dc/text8.zip ) 을 가져 와서 N 단어가있는 줄로 나눕니다. 내 현재 접근 방식은 작동하지만 상당히 느리고 추악합니다 (쉘 스크립트 사용).
i=0
for word in $(sed -e 's/\s\+/\n/g' input.txt)
do
echo -n "${word} " > output.txt
let "i=i+1"
if [ "$i" -eq "1000" ]
then
echo > output.txt
let "i=0"
fi
done
더 빠르고 컴팩트하게 만드는 방법에 대한 팁이 있습니까?