Das Twitter-Archiv der Library of Congress kommt nicht in Gange

Die Library of Congress ist seit fünf Jahren dabei, ein Twitter-Archiv zu erstellen – theoretisch eine gute Idee, praktisch aber immer noch nicht umgesetzt. Schon im Frühling 2010 gab die Library of Congress (LoC), eine der bedeutendsten Bibliotheken weltweit, bekannt, einen großen Schritt zu machen und das komplette Twitter-Archiv zu erwerben, um es für die Forschung zugänglich zu machen. Anfangs hieß es in einem Blogpost der Bibliothek noch “How Tweet It Is!”. Der Post sorgte für viel Trara in den Medien, Bibliotheken-Blogs, Tech Seiten und – was selbstverständlich ist – Twitter selbst. Das ist ja alles schön und gut, nur ist bisher noch nicht wirklich viel passiert.

Mittlerweile sind schon einige Jahre vergangen, seitdem die Bibliothek ihr Vorhaben, angekündigt hat, da sich die LoC immer noch damit beschäftigt, wie sie alle Tweets am besten archiviert und Forschern zur Verfügung stellt, was noch ein Weilchen dauern kann, denn bei allen Tweets handelt es sich um eine knappe halbe Trillion (das sind 21 Nullen) und täglich kommen nochmal um die 400 Millionen Tweets dazu.

Die Aufgabe: Ein riesiges Archiv mit über 20 Milliarden Tweets

Laut LoC-Sprecherin Gayle Osterberg ist die Bibliothek drauf und dran, sich zu überlegen, wie sie die Tweets einteilen und mit einem Inhaltverzeichnis versieht, wobei die Größe der Plattform, aber auch die Quellen, die so eine öffentliche Institution hat, ausreichend sein müssen. Zusätzlich ist die LoC dabei, sich Nutzungsrichtlinien für das Archiv, das es dann ja eventuell bald gibt, zu überlegen. Für das Projekt wurde extra eine Twitter Access Group gegründet, die dafür sorgen soll, dass es nicht mehr so lange dauert, bis das Archiv eröffnet wird.

Das Projekt ist keine einfache Aufgabe, da die Bibliothek ein komplettes Archiv mit gut 20 Milliarden Tweets erstellen und aufbewahren muss. Dabei darf nicht vergessen werden, dass täglich unglaublich viele Tweets dazu kommen, die auch mit in dieses Archiv aufgenommen werden müssen. Dann muss sich die LoC noch Gedanken darüber machen, wie diese Tweets nun indexiert werden sollen und wie sie von den Forschern, die in der Bibliothek Zugriff auf diese haben, am besten durchsucht werden können.

Es läuft ganz und gar nicht nach Plan

Zu dem Fortschritt und den Kosten äußert sich die Library of Congress nicht, doch hinkt sie schon weit hinter ihren eigenen Plänen hinterher: Bereits im Juni 2013 sollte das Archiv für die Forscher zugänglich sein, das geplante Datum kam und ging einfach vorüber, doch ohne, dass das Archiv geöffnet wurde. Und seit etwas über zwei Jahren ist der Stand für die Öffentlichkeit immer noch so ziemlich unverändert.

Die deutsche Informationswissenschaftlerin Katrin Weller wurde 2014 von dem John W. Kluge Center, einem Flügel der Bibliothek, der dazu bestimmt ist, die Kollektionen der Library of Congress für Studien zu verwenden, zu einem der beiden ersten Digitalwissenschafts-Mitgliedern ernannt. Der zentrale Anlaufpunkt dieser Mitgliedschaft sollte das Parsen der Twitter-Sammlung sein, um einen Einblick in historische Events – von Wahlen bis hin zu Naturkatastrophen – zu bekommen. Bevor sie sich jedoch auf den Weg nach Washington machte, sagte sie, dass sie sich vor allem auf ihr eigenes Projekt konzentrieren wird. In einer E-Mail beschrieb Weller ihre jetzige Aufgabe folgendermaßen: “Ich erforsche, ob Social Media Daten eine wichtige Quelle für die Historiker in der Zukunft sein wird und was getan werden muss, um diese Daten zu bewahren.

Eine reine Verschwendung?

Trotz des Enthusiasmus, den Twitter-Mitbegründer Biz Stone in einem Blogpost zeigte, will sich das Unternehmen nicht zu dem Fortschritt des Tweet-Archivs äußern. In das Archiv selbst, was als Geschenk von dem Social-Media-Unternehmen an öffentliche Archivisten angesehen wird, mischt sich Twitter nicht direkt mit ein. Das Unternehmen überlässt der Bibliothek voll und ganz, wie sie das Archiv managen möchte.

Viele werfen der Bibliothek vor, mit dem Projekt bloß Geld und Zeit zu verschwenden, was die LoC aber ganz anders sieht. Für die LoC ist es ein toller Weg, den zukünftigen Generationen zu zeigen, wie die Menschen im 21. Jahrhundert miteinander kommuniziert haben und wird es Forschern ermöglichen, ein besseres Gesamtbild der heutigen kulturellen Standards, Dialoge, oder Trends zu erhalten, die die Forscher laut den Bedingungen dieser Vereinbarung aber nicht kommerziell verwenden dürfen.

Wann mit dem Twitter-Archiv zu rechnen ist, kann bisher wohl niemand so genau sagen.


Image (adapted) „Library of Congress – handheld 3 exposure HDR“ by m01229 (CC BY 2.0)


 

Die Crew der Netzpiloten in Hamburg und Berlin setzt sich zusammen aus rund zehn festangestellten Redakteuren/innen, festen freien Blogger/innen sowie einigen Praktikanten. Alle Texte der Mitglieder unseres ausgedehnten Netzpiloten Blogger Networks erscheinen direkt unter deren Autorenhandle.


Artikel per E-Mail verschicken
Schlagwörter: , , , , ,

1 comment

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert