Python 도구로 Twitter 데이터를 검색하고 JSON 형식으로 내 디스크에 덤프합니다. 큰 따옴표로 묶인 트윗에 대한 전체 데이터 문자열이 의도하지 않게 이스케이프되는 것을 발견했습니다. 또한 실제 JSON 형식의 모든 큰 따옴표는 백 슬래시로 이스케이프됩니다.
그들은 다음과 같이 보입니다 :
"{\"created_at \ ": \"8 월 8 일 금요일 11:04:40 +0000 2014 \ ", \"id \ ": 497699913925292032,
어떻게 피할 수 있습니까? 그것은해야한다:
{ "created_at": "2014 년 8 월 8 일 금요일 11:04:40 +0000".....
내 파일 아웃 코드는 다음과 같습니다.
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
의도하지 않은 이스케이프로 인해 이후 처리 단계에서 JSON 파일을 읽을 때 문제가 발생합니다.