Netz-Architektur und Archive

Archiv Internet, oder?

Was wäre das Internet ohne Suchmaschine? Ein Dorf. Oder viele Dörfer. Datenwachstum und die beständig zunehmende ­Kommerzialisierung des Internets lassen Bibliotheken und Archive im Netz boomen. Doch, kann es Internet-Archive überhaupt geben?

von LUISE WOLF

Das Netzwerk
Niemals zuvor in der Geschichte nutzten so viele Menschen Informationen und Medien, deren Funktionsweise sich so erfolgreich hinter schlankem Hardware-Design versteckt. Das Netz hat eine physische Infrastruktur, die unsichtbar (Funk, WLAN) oder eben einfach nicht sichtbar ist (Glasfaserkabel). Datenspeicher von Millionen Servern und Rechnern bilden das Internet-Archiv. Doch die „Virtual Reality“ - eine scheinbar eigene, räumliche Welt, lebt mindestens genauso stark von unserer eigenen Fantasie, wie zahlreiche Netzwerk-Metaphern andeuten. Und auch kommerzielle Unternehmen nutzen gezielt unsere Einbildungskraft bezüglich des Web. Wir „verlieren“ uns im Netz, von Link zu Link, quer durch Themengebiete, Institutionen und Länder. Spotify entdeckt unsere neue Lieblingsmusik, Facebook-Chronik erinnert unsere Vergangenheit, Google-Suche optimiert unsere Wünsche. Doch welcher Algorithmus steckt dahinter? Firmengeheimnis. Die uns nicht bewusste Automatisierung der Wissensverwaltung macht die Entscheidung, was wir wie und wo suchen, finden oder nutzen oft zu einer Vertrauensfrage.

Wir haben gelernt, dem Archivar oder Bibliothekar zu vertrauen. Würden wir die Such-Funktionen hinter dem Mechanismus - die Algorithmen und Systeme - kennen, könnten wir wohl auch der technisch-mathematischen Objektivität einer Suchmaschine vertrauen.
Netz-Metaphern wie „Datenmeer“ oder „virtuelle Bibliothek“ suggerieren vieles, was das Netz jedenfalls nicht darstellt: einen einheitlichen Informationsraum oder eine geordnete Sammlung, deren Inhalte das öffentliche Interesse widerspiegeln. Alleine der Begriff Netzwerk lässt eine einzige Supermaschine vermuten, während das Internet (von „Interconnected Network“) ein dezentrales, weltweites Netzwerk von Computern ist. Abstrakte, nicht-räumliche „Pakete“ (IP-Internetprotokolle) schicken wir zwischen Computern hin und her, um einander zu identifizieren, und rhizomartige Hypertexte (HTML) sprechen im Netz. Welchen Veränderungen sind wir also in unserer Selbstwahrnehmung und Weltanschauung ausgesetzt, wenn wir uns tagtäglich in dieser virtuellen Realität aufhalten?

Internet Map - Visualisierung von Routen durch Teile des Internets by The Opte Project ©The Opte Project
Internet Map - Visualisierung von Routen durch Teile des Internets
©The Opte Project

Fremde Gehirne
„[A]lles was ich tue, sage und von mir preisgebe, arbeitet in mir fremden Datenbanken und Gehirnen und entwickelt ein gespenstisches Eigenleben“, so beschreibt der Medien-Journalist und Blogger Michael Seemann das Leben im Netz auf seinem Blog „Ctrl-Verlust“. Von einem „verdeckten Gespür für anonyme Regelungssysteme“ schreibt der Berliner Medienwissenschaftler Wolfgang Ernst. Die Unwissenheit über die Funktionsweisen und Kommunikationswege des Web hätte das aktuelle, nostalgische Bedürfnis nach Archiven ausgelöst, eine regelrechte „Archivbesessenheit“. Ein klassisches Archiv bewahrt Verwaltungsakten und stellt diese unter eingeschränkter Zugänglichkeit zur Verfügung. Das Netz jedoch macht Inhalte im Prinzip flüchtig und gegenwartsbezogen, weil viele Inhalte von mehreren Nutzern bearbeitet werden können. Diese Dynamisierung der Inhalte trifft auf eine Technik, deren „Halbwertszeit“ rapide sinkt, so Ernst. Mit welchen Geräten, Geräteeinstellungen und mit welcher Software wir surfen, bedingt schließlich die Ergebnisse. Aufgrund dieser Dynamiken hält Ernst ein Archiv der Netzinhalte für nicht sinnvoll.

Datenmeere ohne Verfallsdatum
Doch wechselnde Hardware und Zugriffsmöglichkeiten werfen andere Fragen auf als Speicherung und Zugänglichkeit. Das digitale Format nutzt sich bekanntermaßen kaum ab. Die stille Regel der Archivare – der Nutzer sei der größte Feind des Archivs – kann hier also getrost ad acta gelegt werden. Die Speicherung erscheint immer unbegrenzter, Hunderte von Gigabytes, gar Terabytes haben alleine auf einer Festplatte Platz. Löschen ist bei solchen Kapazitäten nicht vorgesehen. Und die Datenbanken und Server sind ja da, wenn auch nicht sichtbar. Dies alles spräche für ein Archiv – ein verteiltes Weltarchiv quasi und das Internet als sein Katalog mit variablen Suchfunktionen. Auf Dauer abgestellt sind die meisten Inhalte allemal, denn HTML-Texte haben kein Verfalldatum. Wohl auch deshalb – und weil Zugänglichkeit mehr Wissen provoziert – wächst die digitale Informationsmasse kontinuierlich. Von 1986 bis 2007 sei die weltweite Informationsmenge jährlich exponentiell um 28 Prozent gestiegen, das haben die Forscher Martin Hilbert der University of Southern California in Los Angeles und Priscila López der katalonischen Universität Oberta in Santiago de Chile analysiert. 2007 war demnach nur noch ein Zehntel aller weltweit verfügbaren Daten analog gespeichert worden. Zum Vergleich waren es 2000 noch drei Viertel.

Katalog der Berliner Staatsbibliothek 1949 ©Bundesarchiv
Katalog der Berliner Staatsbibliothek 1949 ©Bundesarchiv

Eine Frage des Formats
Entscheidend für die kritische Auseinandersetzung mit Inhalten im Netz bleibt die Frage des Formats. Was ursprünglich analog produziert wurde und irgendwann im Web landet, hat einen Prozess der Transformation durchlaufen. Schallwellen, Schrift und Bilder liegen dann als Simulationen ihrer selbst vor. Daraus ergibt sich nicht nur Material-, sondern auch Qualitätsverlust. Details sind Spuren der Zeit – der Pinselstrich in einem Bild, Eselsohren oder Kratzer sind Indizien oder Zeugen. Sie sind mit Wissen über die Autorenschaft, Geschichte und Bedeutung aufgeladen. Aber mathematische Codes – die Sprache digitaler Medien – kennen keine Authentizität. Andererseits produzieren wir selbst zunehmend digital-basiert, ob Musik, Text oder Bild. Zumindest die Nachbearbeitung kultureller Artefakte erfolgt heute meist digital. Das analoge Speichermedium wird mehr und mehr zum Luxus- oder Kunstgegenstand – wie gegenwärtig eben mit der Schallplatte oder analoger Fotografie zu erleben ist. Ihr steigender Wert kann als Nostalgie ausgelegt werden, aber auch als ein neu erstarktes Bewusstsein für die Qualität analoger Medien.

Wikis und Open Culture
Konzepte wie Open Source und Open Culture setzen sehr bewusst auf die digitale Transformation von Inhalten, um sie der Gesellschaft unabhängig und frei zur Verfügung zu stellen. Auf dieses Prinzip setzt auch die wohl erfolgreichste virtuelle Bibliothek – die Enzyklopädie Wikipedia. Das von Millionen von Nutzern zusammengetragene „freie Wissen“ unter der Creative Commons-Lizenz steht allen zur Verfügung, auch zur Überprüfung der Daten. Die Schwarmintelligenz generiert erstaunlich niedrige Fehlerraten und bringt der Plattform zusätzlich den Status eines Common-sense-Barometers ein. Wikipedia führt außerdem sein eigenes Archiv erfolgreich mit. Jede Version eines Artikels wird gespeichert und ist für jeden Nutzer einsehbar. Die Schlagwortsuche in herkömmlichen Suchmaschinen listet die unterschiedlichsten Informationen und Quellen auf, die so erst einmal kontextfrei und ahistorisch erscheinen. Demgegenüber stellen z.B. Themenportale oder chronologisch aufgebaute Artikel auf Wikipedia den jeweiligen Kontexte wieder her.

Internet Archive ©Archiv

Internet Archive
Die Geschichte des Web in Webseiten, das Archiv im Archiv – eine Utopie? Ganz und gar nicht. Das „Internet Archive“ ist ein Non-Profit-Unternehmen des Computer Ingenieurs Brewster Kahle in San Francisco. Es digitalisiert und archiviert Inhalte von Medien aller Art. Neben dem beachtenswerten Versuch, die größte digitale, frei zugängliche Bibliothek aufzubauen, versucht es zugleich, ein Internet-Archiv zu erstellen. Es möchte auch die Geschichte des Web dokumentieren, indem etwa Webseiten inklusive der meisten Verlinkungen darauf gespeichert oder „tote“ Links wieder hergestellt werden. Allein 480 Billionen Webseiten hat das Archiv gespeichert. Und jeder kann mitmachen, also heute eine Webseite für die Zukunft sichern. Zum einen ergibt sich dadurch ein ungewohnter wie vielversprechender Blick – Flüchtiges wird gesichert, also zeitlich abruf- und analysierbar. Hier drängt die schiere Informationsflut zu der grundlegenden Frage, was ein Archiv wert ist, das nicht auch selektiv ist? Und auch auf Archive.org befinden sich zahlreiche "tote" Links auf andere Webseiten. So ist auch "Internet Archive" nicht ganz vor der Flüchtigkeit des Netzwerks gefeit. Doch auch in realen Archiven kann mal etwas abhanden kommen.