Biblioteka Kongresu Stanów Zjednoczonych poinformowała, że zakończyła proces zbierania potrzebnych danych. W odpowiedniej kolekcji zarchiwizowanych zostanie ponad 170 bilionów publicznych tweetów.

Wszystko się zaczęło w 2010 roku, kiedy to została stworzona umowa pomiędzy instytucją rządową a Twitterem. W związku z tym platforma mikroblogowa zaczęła zaopatrywać Bibliotekę Kongresu w odpowiednie dane, zaczynając od 21 bilionów wiadomości utworzonych pomiędzy 2006 a 2010 rokiem, aż po pozostałe 150 bilionów tweetów.

Biblioteka w oświadczeniu na temat statusu projektu ogłosiła, iż Twitter należeć będzie do nowego rodzaju kolekcji. Społeczeństwo coraz bardziej skupia swoją działalność wokół wielkich portali społecznościowych oraz używa ich do komunikacji i wyrażania swoich uczuć. W związku z tym powstanie nowa kolekcja, która będzie zawierać archiwum takich wpisów, oczywiście tylko tych publicznych.

Pomimo, że Biblioteka Kongresu Stanów Zjednoczonych dopiero jest w trakcie budowania takiego działu i jeszcze nie dała do niego dostępu osobom postronnym, to i tak zebrała już ok. 400 zapytań od badaczy i naukowców z całego świata. Niewątpliwie stanie się to ciekawym źródłem naukowych prac.

Nadal dokładnie nie wiadomo, w jaki sposób zebrane dane zostaną spożytkowane, aczkolwiek biblioteka udostępniła dokument, w którym można znaleźć trochę informacji dotyczących całego projektu.

Zastanawiacie się ile może ważyć tak wielka baza tweetów? Biblioteka poinformowała, że dwie kopie całej bazy zawierającej 170 bilionów wiadomości obejmuje ok. 133 terabajtów danych. Innymi słowy jest to ok. 136192 gigabajtów.

Dane posłużą zarówno obecnym badaniom jak i tym w przyszłości. Komentujący twierdzą, że za ich pomocą będzie można dokonać takich rzeczy, jak chociażby analizy nastrojów towarzyszących ważnym wydarzeniom, jak np. wyborom prezydenckim czy też wszelkim katastrofom.

A jakie Wy macie zdanie na ten temat?