어떤 명령으로 .raw.gz 파일을 열어야합니까?


0

JSON 인터페이스를 사용하여 트위터에서 스트리밍 된 데이터 파일 인 .raw.gz 파일이 있습니다. Mac OSX에서 어떤 파일을 사용하여 이러한 파일을 열어야하는지 궁금합니다. 나는 tar, unzip, gunzip을 시도했지만 아무도 나를 위해 일하지 않았다.


그러나 gunzip은 .raw 파일을 제공해야합니다. 그런 다음 .raw 파일이 무엇인지 알고 있습니까?

Xichen에 동의하십시오. 따라서 file사용합니다.
Renaud

이것이 내가 gunzip을 실행할 때 얻는 것 hoktay @ csreg193> gunzip twitter_20091006.raw.gz gunzip : twitter_20091006.raw.gz : gzip 형식이 아님
Huseyin Oktay

답변:


1

fileMacOSX에서 사용 가능한 경우 명령을 시도 하여 파일 유형을 확인해야합니다. 어쨌든 x.raw.gz 파일 (일반적으로 x.raw 파일을 제공 함)을 압축 한 후에 그렇게해야한다고 생각합니다. 일반적으로 gunzip을 수행 한 후 원시 json 텍스트 파일을 얻어야합니다.


이것이 내가 파일 명령을 when을 때 얻는 것입니다 : file twitter_20091006.raw.gz twitter_20091006.raw.gz : data
Huseyin Oktay

아야… 텍스트 모드에서 파일을 열려고 읽을 수있는 텍스트가 있는지 확인하셨습니까? 그 파일을 어떻게 얻었는지 공유 할 수 있습니까? 도움이 될 수 있습니다.
Renaud

파일을 얻는 방법에 대한 정보입니다. 파일에는 더 큰 연속 수집이 포함됩니다. 파일은 JSON 형식입니다. curlStream.bat는 트위터 스트림을 다운로드하기 위해 cURL이라는 프로그램과 함께 사용되었습니다. 트위터 API는 apiwiki.twitter.com/Twitter-API-Documentation에 있습니다. 대부분의 JSON 필드는 apiwiki.twitter.com/Return-Values에 정의되어 있습니다 . curlStream.bat은 설명서와 함께, 트위터 스트리밍 API를 호출 apiwiki.twitter.com/Streaming-API-Documentation .
Huseyin Oktay

그리고 열려고했지만 불행히도 사람이 읽을 수있는 텍스트는 아닙니다.
Huseyin Oktay

좋아, devtwitter에 자신을 등록하고 싶지 않기 때문에 테스트 할 수 없습니다. 어쨌든 curl은 기본적으로 표준 콘솔 출력에서 ​​데이터를 리디렉션해야하기 때문에 일부 curl 매개 변수를 조정할 때 Twitter API에서 기본 curl 호출을 시도 할 수 있다는 조언이 있습니다 (참조 curl -h).
Renaud
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.