Odpowiedzi:
Utworzono duży indeks stron na Facebooku i jest on dostępny jako torrent (jest to ~ 2,8 Gb) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
Zestawy danych na Twitterze są oznaczone na Infochimps: http://infochimps.com/tags/twitter
Zestaw danych lastfm jest dostępny pod adresem http://mtg.upf.edu/node/1671
Właśnie to znalazłem: 476 milionów tweetów z Twittera (przez @yarapavan ).
Opracowaliśmy zbiór danych na Twitterze dla przyjaciół użytkowników w 2009 r., A następnie w 2009 r. Więcej informacji można znaleźć tutaj: http://strict.dista.uninsubria.it/?p=364
Wykres społecznościowy na Facebooku, instalacje aplikacji i użytkownicy Last.fm, wydarzenia, grupy na http://odysseas.calit2.uci.edu/research/
Dwa zestawy danych (zebrane od kwietnia do maja 2009 r.), Które zawierają reprezentatywne próbki około 1 miliona użytkowników na całym Facebooku, z kilkoma adnotacjami: dla każdego próbkowanego użytkownika dołączono listę znajomych, ustawienia prywatności i członkostwo w sieci. Trzeci zestaw danych (zebrany w lutym 2008 r.) Zawiera dwustronny wykres reprezentujący instalacje aplikacji przez użytkowników Facebooka. Czwarty zestaw danych z Daily Active Users i instalacjami aplikacji w ciągu 6 miesięcy (zebrany wrzesień 2007-luty 2008). Piąty zestaw danych, który obejmuje reprezentatywną próbkę użytkowników Last.fm uzyskaną za pomocą próbkowania multigraph (zebrane w lipcu 2010 r.).
Dobrym źródłem do znajdowania zestawów danych jest:
/ r / zestawy danych w Reddit.
Szybkie spojrzenie na tę stronę ujawnia to źródło , które może zawierać coś przydatnego.
W tym artykule wykorzystano zestaw danych Facebooka, który jest dostępny tutaj. Oto opis autorów:
Dane obejmują pełny zestaw węzłów i łączy (oraz niektóre informacje demograficzne) ze 100 amerykańskich szkół wyższych i uniwersytetów z jednorazowej migawki z września 2005 r.