답변:
페이스 북 페이지의 큰 인덱스를 생성하고, 토런트 (그것은 ~ 2.8Gb입니다)으로 사용할 수 있었다 http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
트위터 데이터 셋은 Infochimps에 태그됩니다 : http://infochimps.com/tags/twitter
lastfm 데이터 세트는 http://mtg.upf.edu/node/1671 에서 사용 가능합니다 .
방금 476 백만 트위터 트윗 ( @yarapavan 통해 ) 을 찾았습니다 .
우리는 2009 년과 2009 년에 사용자의 친구들을위한 트위터 데이터 세트를 선별했습니다. 자세한 정보는 여기에서 찾을 수 있습니다 : http://strict.dista.uninsubria.it/?p=364
http://odysseas.calit2.uci.edu/research/의 Facebook 소셜 그래프, 응용 프로그램 설치 및 Last.fm 사용자, 이벤트, 그룹
Facebook 전체에서 ~ 100 만 명의 사용자를 대표하는 샘플이 포함 된 두 개의 데이터 세트 (2009 년 4 월 ~ 5 월에 수집)에는 주석이 달린 속성이 있습니다. 각 샘플 사용자, 친구 목록, 개인 정보 설정 및 네트워크 멤버쉽이 포함되어 있습니다. 세 번째 데이터 집합 (2008 년 2 월 수집)에는 Facebook 사용자의 응용 프로그램 설치를 나타내는 이분 그래프가 포함됩니다. 6 개월 동안 Daily Active Users 및 응용 프로그램 설치가 포함 된 네 번째 데이터 세트 (2007 년 9 월 ~ 2008 년 2 월 수집). 멀티 그래프 샘플링 (2010 년 7 월 수집)을 사용하여 얻은 Last.fm 사용자의 대표적인 샘플을 포함하는 다섯 번째 데이터 세트입니다.
데이터 세트를 찾는 데 유용한 리소스는 다음과 같습니다.
Reddit의 / r / datasets
해당 페이지를 한 눈에 살펴보면 이 소스 가 표시되는데 여기에는 유용한 정보가 포함되어있을 수 있습니다.
이 백서 는 여기에 있는 페이스 북 데이터 셋 을 사용합니다. 다음은 저자의 설명입니다.
이 데이터에는 2005 년 9 월 한 번의 스냅 샷을 통해 미국의 100 개 단과 대학 및 종합 대학 의 전체 노드 및 링크 (및 일부 인구 통계 정보)가 포함됩니다 .