커맨드 라인에서 누군가의 트윗을 검색하는 간단한 방법이 있습니까?
계정은 공개적이며 명령 또는 스크립트 (필요한 경우)는 메타 데이터없이 첫 번째 행에서 가장 최신 인 메타 데이터없이 텍스트 파일에 대해 가장 최근의 트윗 또는 전체 수의 최근 트윗을 검색합니다.
API를 사용하지 않으면 bash 만 가능합니다.
커맨드 라인에서 누군가의 트윗을 검색하는 간단한 방법이 있습니까?
계정은 공개적이며 명령 또는 스크립트 (필요한 경우)는 메타 데이터없이 첫 번째 행에서 가장 최신 인 메타 데이터없이 텍스트 파일에 대해 가장 최근의 트윗 또는 전체 수의 최근 트윗을 검색합니다.
API를 사용하지 않으면 bash 만 가능합니다.
답변:
마감일부터 트위터는 OAuth 키가 없으면 API를 사용할 수 없습니다. 그러나 해결 방법으로 Search API를 사용할 수 있습니다. RESTful이므로 curl
검색 결과를 JSON 형식으로 검색 하는 데 사용할 수 있습니다 . 예를 들어 @java의 트윗을 검색하여 file에 저장하려면 다음 ~/.tweets
코드 줄을 사용할 수 있습니다.
curl http://search.twitter.com/search.json?q=from:java&page=1&rpp=10&callback=? >> $HOME/.tweets
JSON 파서를 사용하여 파일을 구문 분석 할 수 있습니다.
rpp
매개 변수는 트윗 AF 번호를 검색 할 수 있습니다. callback
결과 JSON에서 실행될 자바 스크립트 함수입니다. API와 함께 JavaScript를 사용하지 않는 경우에는?를 그대로두고 제거하지 마십시오. 오류가 발생합니다. 검색 API에 대한 자세한 지침은 https://dev.twitter.com/docs/api/1/get/search 에서 찾을 수 있습니다.
명령 행 인터페이스에서 JSON을 구문 분석하는 도구가 있습니다. 한 번도 사용하지는 않았지만 가장 적합한 도구를 찾는 데 도움이되는 몇 가지 리소스에 대한 링크를 제공합니다.
그리고 약간의 참고로, 파이썬이나 루비 (또는 다른 것)를 사용하는 것이 더 빠릅니다.
Twitter API를 사용하지 않으려면 bash 스크립트를 사용하여 Twitter 프로필의 RSS 피드를 가져 와서 형식화 할 수 있습니다.
Twitter API는 RSS 피드를 더 이상 사용하지 않으므로 검색 결과를 사용하여 RSS 피드를 생성하여이 문제를 해결할 수 있습니다.
그래도 필요한 bash 스크립트를 작성해야합니다. RSS 피드 가져 오기에서 요구 사항에 따라 트윗 형식화에 이르기까지.
이것은 스크린 세이버 사용을 위해 만든 스크립트입니다
#!/bin/bash
user="$1"
user="${user:=pontifex_pl}"
last_status_url=$(lynx -dump https://twitter.com/$user \
| grep -i "$user/status/" \
| head -1 \
| awk '{print $2}')
lynx -dump "$last_status_url" \
| grep 'Twitter:' -m1 -A4 \
| tr -d '\n' \
| sed -e 's/[^"]*"//' -e 's/".*//' \
| tr -s ' '
echo
나는 당신이 묘사 한 것과 정확히 일치하는 도구를 만들었습니다 : twitter-screen-scrape . 기본적으로 메타 데이터와 함께 JSON으로 출력되지만 원하지 않는 모든 것을 제거하기 위해 underscore-cli 와 같은 것을 통해 출력을 파이프하는 것은 쉽지 않습니다.
$ twitter-screen-scrape -u slang800 | underscore pluck text --outfmt text > outputfile
python + tweepy route는 다음과 같이 갈 수 있습니다.
방금 테스트했으며 훌륭하게 작동합니다. 그러나 트윗을 보호하는 사용자가 있으므로 모든 것을 다운로드하지 못할 수 있습니다. 그러나 그것은 트위터의 기능입니다.
여전히 제한은 3200이며 CSV 파일을 얻습니다.
사용 twarc
하는 Nassim Nicholas Taleb의 트윗을 보관하려면 예를 들어 사용할 수 있습니다.
twarc timeline nntaleb --format csv> taleb.csv
다른 형식도 사용할 수 있습니다. --format {json,csv,csv-excel}
구성 방법 twarc
:
전체 트윗을 얻는 유일한 방법은 API
불행히도 앱이 투명하더라도 초기 설정 및 구성이 필요하지만 API
(
2018 년 7 월부터 새 앱을 만들려면 Twitter 개발자 계정을 신청하고 승인을 받아야합니다.
)
일단 당신이 당신의 응용 프로그램 키를 가지고 당신은 말할 수 twarc
그들이 구성 명령이 무엇인지.
twarc configure
이것은라는 파일에 자격 증명을 저장합니다 .twarc
당신이 그들을 계속 입력하지 않아도 사용자의 홈 디렉토리를. 당신이 아니라 직접 제공 할 경우에는 환경을 설정할 수 있습니다 ( CONSUMER_KEY
, CONSUMER_SECRET
, ACCESS_TOKEN
, ACCESS_TOKEN_SECRET
) 또는 (명령 줄 옵션을 사용하여 --consumer_key
, --consumer_secret
, --access_token
, --access_token_secret
).