Das Netz hat (noch) kein Gedächtnis

Von der Wut des Speicherns

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Allein das Web allein ein riesiger Speicher an Informationen, der mit einer jährlichen Zunahme um das Zehnfache ungeheuer schnell wächst und schon bald möglicherweise in die Größenordnung des umfangreichsten traditionellen Gedächtnisses rückt, also den 20 Terabyte (20000 Gigabyte) an gedruckter Ascii-Information der Library of Congress, wenn man davon aus geht, daß die Bibliothek 20 Millionen Bücher mit jeweils einem Megabyte enthält. Aber natürlich ist der Speicher dieser Bibliothek noch weitaus größer und geht in die Pentabytes, wenn man die Photographien, Landkarten, Filme oder Tonaufzeichnungen mit berücksichtigt.

Zunächst und oberflächlich denkt man wohl, daß das Web besser als jedes andere Speichermedium zuvor ist, um schnell und einfach gigantische Mengen an sich dynamisch verändernden und miteinander verknüpften Informationen aufzunehmen. Wenn manche sich das Netz als globales Gehirn vorstellen, dann würde es rasch in seinem Ausmaß zunehmen und immer mehr Gedächtnisinhalte aufnehmen, deren Verbindungen den Assoziationsreichtum stärken, wenn es denn so etwas wie ein Langzeitgedächtnis gäbe, die Neuronen, hier also die mit dem Netz verknüpften Computer, auf die Dauer mit ihm verbunden wären und für sehr lange Zeit auch eine universelle Sprache zur Kommunikation der "Neuronen" existieren würde.

Größere Speicher - kürzeres Gedächtnis

Aber was wie ein besonders guter und langlebiger Speicher erscheint, entlarvt sich schnell als ein flüchtiges und vergeßliches Medium, als ein mit einem Alzheimer-Defekt belastetes Kurzzeitgedächtnis, aus dem das meiste sehr schnell wieder verschwindet und durch Neues ersetzt wird. Relikte oder Ruinen bleiben auf dieser permanenten Baustelle kaum und nicht für lange Zeit zurück. Es gibt kein Sediment, keine Spuren, keine Schichten, in denen man nachgraben und wieder Entdeckungen machen könnte. Es ist eher wie eine dauernde Halluzination oder ein Labyrinth, durch das man stolpert und immer wieder an Stellen kommt, wo Wege ins Leere gehen, die nicht vor allzulanger Zeit einmal woandershin führten. Über die Hälfte des World Wide Web verschwindet jeden Monat, auch wenn es selbst in dieser Zeit sich verdoppelt. Und die Lebensdauer einer durchschnittlichen Web-Page ist gerade einmal 70 Tage. Aber das Web und insgesamt das Internet stehen nicht alleine als unwiederbringliche und kurzlebige Datenverschlucker, während sie uns zugleich mit Daten überschwemmen und manche ein information overload fürchten.

Historiker werden auf diese Zeit zurückblicken und eine Periode mit sehr wenigen Informationen wahrnehmen. Eine 'digitale Kluft' wird sich vom Beginn der weit verbreiteten Benutzung des Computers bis zu der Zeit erstrecken, in der wir schließlich dieses Problem lösen.

Danny Hillis

Im neu eröffneten Getty Center in Los Angeles fand Anfang Februar eine Tagung mit dem Titel Time and Bits statt, in der es unter anderem um die Frage ging, wie die Digitalisierung der Information und damit der Kultur und Zivilisation auch für die Nachwelt bleibende Informationsspeicher bilden kann. Wie die Dinge jetzt laufen, können wir zwar in der Archivierung von digitalen Daten ertrinken, nur wird in ein paar Jahrhunderten oder Jahrtausenden niemand mehr wissen können, was in unserer Zeit geschehen ist. Zeichen auf Steintafeln oder sogar auf Papier können bei geeigneter Lagerung Jahrhunderte und Jahrtausende überdauern, Informationen auf Videofilmen oder Magnetbändern mehr oder weniger 20 Jahre, Daten auf einem Mikrofilm vielleicht 500 Jahre, aber solche, die auf einer Diskette oder einer CD-ROM gespeichert wurden, halten hingegen vielleicht gerade einmal 25 Jahre.

Aber natürlich ist die Situation noch viel schlimmer, denn selbst wenn optische Speichermedien die Informationen für lange Zeit unbeschadet bewahren könnten oder sie beim Kopieren nicht beschädigt würden - wer wird sie in 100 Jahren noch lesen können, wenn die entsprechenden Laufwerke längst verschwunden sind und neue Formate die alten in Vergessenheit geraten ließen, einmal ganz abgesehen von verschlüsselten Daten? Ohne die entsprechenden Geräte, die notwendige Software und das erforderliche Spezialwissen bleiben die gespeicherten Daten wahrscheinlich unverständlich. Wenn es mit der jetzigen Innovationsgeschwindigkeit weiter geht, dann sind Daten, die vor 10 Jahren gespeichert wurden, für viele schon nicht mehr ohne weiteres zugänglich. Auch die zusätzliche Speicherung von Metadaten zur Kontextualisierung von Daten steht vor demselben Problem.

Digitale Daten können nicht einmal wie Hieroglyphen entziffert werden, weil sie nur in Form von Pits - mikroskopisch kleinen Vertiefungen auf der Scheibe - existieren, die alles und nichts bedeuten können. Ohne Kontextinformation kann man eine Bitfolge nicht interpretieren, die unendlich viel "bedeuten" kann, was andererseits gerade die Universalität des digitalen Codes ausmacht. Während in materiellen Speichern abgelegte Informationen direkt zugänglich sind, ist jetzt eine Maschine nötig, um überhaupt die abgespeicherte Information sehen zu können.

Digitale Information durchdringt jeden Aspekt des Alltagslebens: von den internationalen Finanzmärkten bis zur Kasse eines Lebensmittelgeschäfts, von den mentalen Bildern der Kinder von Dinosauriern, abgeleitet von computererzeugten Filmbildern, bis zu den computererzeugten Voyager-Bildern des Sonnensystems, von Datenbanken, die die Stellen von Giftmüll verzeichnen, bis zu solchen, in denen sich die Daten von unserer Sozialversicherung und unserer Renten befinden. Was wäre, wenn die digitale Information, mit denen wir unser Leben und unsere Institutionen steuern, verschwinden würden? Welches Bild des Lebens im ausgehenden 20. Jahrhundert könnten die Historiker der Zukunft aufdecken, wenn die einzige überdauernde Erinnerung an unsere Zeit auf Papier gedruckt wäre?

Peter Lyman & Howard Besser

Angst vor dem Verlust

Peter Lyman und Howard Besser schrieben einen Grundlagentext für die Konferenz über die Vergänglichkeit der Bits in der Zeit und - mehr oder weniger unausgesprochen, aber ziemlich deutlich - die Notwendigkeit der Archivierung. Kurz vor der Jahrtausendwende wollen wir uns, die Generation, die mit den Computern groß geworden ist, aber nicht schon selbstverständlich seit ihrer Geburt in ihrer Umgebung gelebt haben, der Nachwelt überliefern. Wir wollen nicht nur alt werden, sondern die biologischen Grenzen des Alterns überschreiten, hoffen auf das Unsterblichkeitsenzym, die Kryonik, das Speichern von genetischen Daten zur Wiederauferstehung, auf alle möglichen technischen Implantate oder auf das Klonen.

Und wenn wir uns schon nicht selbst der Zukunft aufdrängen können, dann werden wir zumindest die Umwelt, das ganze ökologische System tiefgreifend und langfristig verändern, als wäre ein Komet eingeschlagen und hätte nur eine Arche Noah übriggelassen, der wir nun unser Andenken sicher in Informationen übergeben wollen, in die wir auch die aussterbenden Tier- und Pflanzenarten verwandeln, weil schließlich Leben nichts anderes ist als biologische Information. Hitler und sein Baumeister haben noch davon geträumt, daß das Tausendjährige Reich auch für viele Tausend Jahre wie die alten Kulturen ihre Monumente hinterlassen wird, aber gleich ästhetisch als vorgeformte Ruinen aufbereitet. Aber welche ästhetisch interessanten Ruinen hinterläßt schon ein unlesbarer digitaler Code oder die kaputte Hardware der Computer? Wir können - und wollen - nicht den biologischen Code mit seiner Evolution imitieren, der sich zwar ziemlich dauerhaft fortschreibt, aber nur durch den Preis, immer neue Ergebnisse hervorzubringen. Wir wollen anscheinend alles konservieren, einätzen und den Menschen nach uns - wenn es denn noch welche sind - mit Geschichte vollstopfen.

Offenbar ängstigen uns schon ein paar möglicherweise verlorengehende Jahrzehnte der digitalen Geschichte. Das Jahr 2000 droht, und damit dank unserer noch nicht dafür eingerichteten Computer der Beginn des Datenverlustes: des Verlustes "des Großteils des digitalen Gedächtnisses und damit der neuen Geschichte der Wissenschaft und Technologie, der Aufzeichnungen der Regierung und der Firmen, der Populärkultur und der digitalen Künste." Die Autoren erwähnen natürlich auch, daß nicht nur digitale Daten, sondern auch das Papier, auf dem heute gedruckt wird, keine große Lebensdauer hat, weswegen das Kopieren und Speichern in digitalen Medien einst als Alternative verstanden wurde.

Je mehr Informationen wir speichern können, desto eher werden wir künftigen Generationen einen 'Schlüssel" geben können, um die Inhalte von ganzen Klassen verlorener Daten aufzuschließen.

Peter Lyman und Howard Bresser

Die Bibliotheken - und Museen, aber auch Tiergärten und Botanische Gärten - sind die Archive der Kultur vor dem digitalen Zeitalter. Gesammelt aber wurde und wird hier nicht alles, auch wenn das vielleicht die Intention sein mag, sondern es wird selektiert. Das schafft Ungerechtigkeiten, und wir wissen aus der Geschichtswissenschaft, daß uns zwar oft Dokumente und Hinterlassenschaften der "großen Menschen" aus der Geschichte zur Verfügung stehen, das Alltagsleben der gewöhnlichen Menschen aber kaum Spuren hinterlassen hat. In Kunstmuseen werden ebenfalls die "großen Künstler" gesammelt, von denen man glaubt, daß ihr Werk eine wichtige Erbschaft für die Menschen darstellt. Dann findet auch eine Art Sammlung von Reliquien statt: jeder Fitzel wird aufbewahrt, um Zeugnis vom großen Menschen abzulegen und um von den Kunstpriestern gedeutet zu werden, während das Leben und Werk der meisten Künstler nach und nach verschwindet und nur zufällig erhalten bleibt. Künstler haben in der Moderne im übrigen auch selbst die Strategie ausgebildet, Sammlungen auch der scheinbar banalsten Dinge als Kunstwerke anzulegen.

Wenn man von etwa 6 Milliarden Menschen, die heute auf der Erde leben, ausgeht, dann ist die Summe des Gedächtnisses aller Menschen etwa 1200 Petabytes. ... Wir können alles digital speichern, an das sich jemand erinnert. Für einen einzelnen Menschen ist das nicht einmal schwierig. Landauer schätzte, daß Menschen nur ein Byte pro Sekunde aufnehmen und erinnern. Die typische Lebenszeit beträgt 25000 Tage oder 2 Milliarden Sekunden, wenn man die Schlafzeit mitzählt. Das Ergebnis summiert sich auf 2 Gigabyte oder eine Menge, die auf das Laufwerk eine Laptop paßt.

Micheal Lesk

Kultur: Speichern oder Vergessen?

Die digitalen Medien scheinen einen großen Vorteil als Speicher gegenüber herkömmlichen Speichern für Materialien zu bieten: sie werden immer billiger, leistungsstärker und kleiner. Riesige Bibliotheken verschwinden so und werden zusammengepreßt. Heute werden bereits jährlich Computerspeicher in einer Größenordnung von Zehntausenden von Terabytes verkauft: "Im Jahr 2000 werden wir", so Michael Lesk, "in digitaler Form alles speichern können, was wir wollen, was auch die Digitalisierung aller Telefonanrufe in der Welt, aller Tonaufzeichnungen und aller Filme einschließt ... Bald nach dem Jahr 2000 wird die Produktion von Datenspeichern die menschliche Produktion von Information, die man auf ihnen ablegen kann, überschreiten. Die meisten Speichereinheiten der Computer werden Informationen enthalten müssen, die von Computern erzeugt werden. es wird einfach nicht genügend anderes geben."

Das aber verführt dazu, die Selektion aufzugeben und immer mehr zu speichern. Lesk glaubt denn auch, daß es bald tragbare Computer geben wird, mit denen sich alles speichern lassen könnte, was jeder Mensch auf der Erde schreibt, sagt, macht oder photographiert. Nur wird sich das wohl niemand mehr anschauen. Je größer die Informationsmengen sind, die produziert und gespeichert werden, desto weniger werden sie zur Kenntnis genommen und desto eher werden sich - wie früher auch - Inseln der Aufmerksamkeit herausbilden, während alles andere zwar vorhanden ist, aber kaum oder gar nicht zur Kenntnis genommen wird. Vielleicht also werden wir es den digitalen Agenten und Computern in Zukunft überlassen, für uns diese Inseln auszuschneiden.

Man geht davon aus, daß wir seit 1945 Hundert Mal mehr Informationen erzeugt und gespeichert haben, als dies die Menschen während ihrer ganzen Geschichte gemacht hatten.

Doug Carlston - Storing Knowledge

Menschliche Kognition ist nicht nur ein Speicher. Das Großteil des Gehirns wird auch nicht vom Gedächtnis belegt. Auch wenn das Gedächtnis wichtig ist, um die Wahrnehmung und andere Programme, also den Arbeitsspeicher, durch Routinen und Simulationen von Echtzeitdarstellungen zu entlasten, ist die Hauptaufgabe etwa der Wahrnehmung die Filterung, Reduzierung und Bewertung möglicher Information. Und auch das Vergessen ist lebenswichtig, um nicht in Erinnerungen zu ersticken und den neuronalen Prozessor zu überlasten. Die Funktion der Selektion, also der Bewertung, und des Vergessens, ist aber bislang nicht auf effiziente Weise mit Computern zu simulieren oder zu emulieren. Und wenn wir Maschinen oder Roboter hätten, die selektieren und vergessen, dann sind es auch keine verläßlichen Mechanismen mehr, sondern dann werden sie zu eigenwillige Kreaturen.

Um die gespeicherten Files in der Zukunft verwenden zu können, muß man sie vieleicht in neue Formate übertragen. Text, Bilder, Audio- und Videofiles verändern sich in unterschiedlichen Geschindigkeiten.

Brewster Kahle

Bislang wird also mit den technischen Möglichkeiten eher das Speichern von allem anvisiert und dem Veralterungsprozeß zufällig das Löschen oder Vergessen überlassen. Brewster Kahle hat so als erster 1996 begonnen, ein Internet-Archiv anzulegen. Den Dienst Alexa, den er auch betreibt, archiviert nicht nur von Zeit zu Zeit das Internet (Web, Newsgroups, FTP, Gopher ...), sondern hält auch fest, wieviele Besucher auf eine Site kommen, wie oft sie erneuert und wie oft die verlinkten Sites benutzt werden. Benutzer können auch, wenn etwas verschwunden ist und man auf die Meldung "404 File Not Found" stößt, Seiten aufrufen, die aus dem Web bereits verschwunden sind. 1996 waren 6 Terabyte, Ende 1997 10 Terabyte an Daten gespeichert, wobei allein das Web sich alle 6 Monate verdoppelt, andererseits aber vieles wieder aus ihm verschwindet. Da Kahle aber nicht permanent abspeichern kann, geht selbstverständlich vieles verloren, denn auch Sites wie MSNBC oder CNN archivieren ihre aktuellen News nicht auf Dauer.

Aber eine solche "Überwachung" des Internet ist neben dem Selektionsproblem auch problematisch, weil sie die neuen Eigentumsverhältnisse mißachtet. Der Umfang des "geistigen Eigentums" wird derzeit mehr und mehr ausgebaut und geschützt. Damit könnte eine Archivierung des gesamten Netzinhaltes unmöglich werden. Was macht man mit Inhalten, die in einem Land erlaubt und in einem anderen verboten sind? Was geschieht mit Inhalten, die dessen Schöpfer oder Eigentümer bewußt löscht, die aber in einem Internetarchiv weiterhin verfügbar wären? Kahle räumt es "Autoren", ihre Information aus dem Archiv auszuschließen, um entsprechende Probleme des Copyright oder des Datenschutzes zu vermeiden, aber wenn jeder nachprüfen wollte, was von ihm archiviert wurde und dann zum Löschen auffordert, wäre das eine Sysiphosarbeit, die wiederum den dynamischen und verlinkten Charakter des Web verletzen würde, falls jemand sich tatsächlich auf die Suche machen würde.

Es ist möglich, fast ohne Erinnerung zu leben, ja glücklich zu leben, wie das Tier zeigt; es ist aber ganz und gar unmöglich, ohne Vergessen überhaupt zu leben ... Es gibt einen Grad von Schlaflosigkeit, von Wiederkäuen, von historischem Sinne, bei dem das Lebendige zu Schaden kommt und zuletzt zugrunde geht, sei es nun ein Mensch oder ein Volk oder eine Kultur.

Friedrich Nietzsche

Niemals jedoch gab es, bevor die digitalen Speicher entstanden, den Wunsch, möglichst alles zu konservieren und nichts, nicht einmal die bedeutungslosesten Web-Pages oder Postings in Newsgroups, dem Vergessen anheimzugeben. Das Ideal, alles, was ein Mensch macht und erlebt, in möglichst vielen medialen Formen festzuhalten, korrespondiert mit dem Prinzip der sogenannten Wissens- und Informationsgesellschaft, immer mehr Programme, Maschinen und Medien zu schaffen, um immer mehr Informationen und Daten zu erzeugen, zu verarbeiten und zu speichern. Je mehr Daten aber zirkulieren und verfügbar sind, desto eher wird auch ihr Wert verfallen und die selektive Aufgabe der Aufmerksamkeit immer drängender werden. Natürlich läßt sich auch Aufmerksamkeit automatisieren und an künftige künstliche Intelligenzen zur Verwaltung delegieren, aber dadurch werden nur noch mehr Daten, Programme und Maschinen gebaut. Vielleicht ist die unfreiwillige "Vergeßlichkeit" durch die schnelle Innovationsgeschwindigkeit der einzige Trick der technischen Evolution, die vielen Daten loszuwerden, um nicht in ihnen unterzugehen.

Der destruktive Charakter kennt nur eine Parole; Platz schaffen; nur eine Tätigkeit: räumen. Sein Bedürfnis nach frischer Luft und freiem Raum ist stärker als jeder Haß.

Walter Benjamin

Seit der Archivierungs- und Erhaltungswut, die mit der Aufklärung erst wirklich einsetzte, entflammte hier und da auch ein Widerstand. Es sind nicht die Bilderstürmer, sondern das Anliegen der neuen Vandalen ist eine Art Aufstand gegen die Geschichte, um wieder Platz zu schaffen und Orientierung zu finden. Man muß zerstören, um etwas schaffen zu können - mit dem Risiko, gelegentlich auch Wertvolles einzubüßen, aber das Herausfischen des Wertvollen, das mitunter auch die Menschen oder ihre Nachfolger in 100 oder gar 1000 Jahren noch interessieren könnte, wird mit der explodierenden Informationsproduktion immer schwieriger.

Vielleicht sollte man es auch gar nicht der technischen Evolution überlassen, immer einmal wieder die Datenspeicher zu säubern, während man gleichzeitig Institutionen zu schaffen wünscht, die zur Erhaltung digitaler Daten berufen sind, sondern Institutionen zur Vernichtung von Daten einrichten. Erfreulicherweise können digitale Daten, wenn man sie löscht - anders als die materiellen Speicher -, ohne Rückstände vernichtet werden. Sie bilden keinen Müll, mit dem man die nachfolgende Generation belastet. Müll, wie besonders der nukleare Abfall, stellt ganz andere, aber sehr ähnliche Aufgaben des Umgangs, wenn man überlegen sollte, wie man Lagerplätze mit verstrahlendem Material über Jahrtausende schützen und markieren soll, so daß auch die Menschen in ferner Zukunft davor gewarnt sind, sofern es überhaupt sicher "verpackt" wurde und sich nicht in der Ökosphäre ansammelt.