큰 CSV 파일을 가져온 다음 파일에서 각 단어의 발생 횟수를 계산 한 다음 다른 CSV 파일로 내보내는 Python 스크립트가 있습니다.
그러나 일어나는 일은 일단 계산 부분이 완료되고 내보내기가 시작 Killed
되면 터미널에 말합니다 .
나는 이것이 메모리 문제라고 생각하지 않습니다 (만약 내가 메모리 오류가 아니라고 가정한다면 Killed
).
프로세스가 너무 오래 걸릴 수 있습니까? 그렇다면 제한 시간을 연장하여 이것을 피할 수 있습니까?
다음은 코드입니다.
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
그리고 인쇄 Killed
후 발생 finished counting
하며 전체 메시지는 다음과 같습니다.
killed (program exited with code: 137)