Dieser Vortrag ist in Ausgabe 23-2007 der Zeitschrift PHOTO PRESSE erschienen.
Eine Kopie des Artikels können Sie hier herunterladen.

Archive und Bibliotheken, konventionelle Datenträger

Am 2. September 2004 vernichtete ein Großbrand in der weltberühmten Herzogin-Anna-Amalia-Bibliothek in Weimar rund 30.000 teils unersetzliche historische Bücher – ein schwerer Verlust für das deutsche Kulturerbe.

Unsere Kultur hat durch das Buch und die Archivierung von Büchern in Bibliotheken ein universales Langzeitgedächtnis bekommen. Dieses ist nicht gegen Unglücke gefeit. Katastrophen vernichten in wenigen Stunden, was über Jahrhunderte an Informationen für künftige Generationen gesammelt wurde.

Es sind nicht nur die großen Katastrophen, die unsere Bücher gefährden. Als immer mehr Menschen Bücher und Zeitungen lesen konnten und wollten, stieg etwa ab 1850 der Bedarf an Papier rapide an. Es wurde Papier von mäßiger Qualität produziert, um den Bedarf zu decken. Das sorgt heute für gewaltige Probleme: Weil dieses Papier stark säurehaltig ist, droht der so genannte Säurefraß Unmengen von Büchern zu zerstören. Bis zu 60 Millionen Bücher, so schätzen Experten, zerbröseln in den kommenden Jahren in deutschen Bibliotheken. In späteren Jahren hat man die Papierherstellung so verändert, dass nicht mehr zu viel Säure entstehen konnte.

Halten wir fest: Die Menschheit hat ein Problem mit ihren Datenträgern. Wie sieht es mit der Lebensdauer unserer konventionellen Datenträger aus?

Einige Beispiele:

  • Die Keilschrift auf Tontafeln: Mehrere tausend Jahre.
    In der Zwischenzeit war jedoch der Code für sehr lange Zeit verloren. Erst 1802 gelangen dem deutschen Philologen Grotefend erste Schritte zur Entzifferung.
  • Bücher und Handschriften aus säurefreiem Papier und nicht eisenhaltiger Tinte: Mehrere hundert Jahre.
  • Bücher und Handschriften aus säurehaltigem Papier: 70 bis 100 Jahre.

Traditionell sind Archive und Bibliotheken zuständig für die Langzeitarchivierung von Dokumenten. Diese überdauern dort lange Zeiträume besonders gut, wenn man sie unter optimalen Bedingungen in Ruhe lässt.

Die Digitalisierung

Inzwischen haben digitale Dokumente weitgehend ihre konventionellen Vorgänger abgelöst. Ein großer Teil der Daten, die heute weltweit produziert werden, sind bereits digitalen Ursprungs und sie enthalten eine große Palette an unterschiedlichen Formaten: Text, Bild, Datenbank, Audio, Film. Weit mehr als 90 Prozent der Gegenwart sind auf digitalen Datenträgern gespeichert. Der Berg an Informationen – und damit der Speicherbedarf – wächst jährlich um 30 Prozent. Die Menge an heute produzierter Information wäre auf Papier nicht archivierbar.

Hier vollzieht sich ein von vielen kaum registrierter Schwelbrand. Dieser ist wenig spektakulär, aber mit weitreichenden Folgen und dem Verlust großer Mengen an Information. Das folgende Beispiel zeigt anschaulich die Problematik:

Der erste PC kam vor 28 Jahren (1979) auf den Markt; es war der erste Computer, der sich auch im Privatbereich sehr schnell verbreitete. Nehmen wir einmal an, jemand arbeitet seit 20 Jahren mit Computern und hat wichtige Informationen auf Diskette gespeichert – damals wahrscheinlich auf einer 5 ¼– Zoll-Diskette. Er findet diese Diskette wieder und versucht sie zu lesen. Was passiert voraussichtlich?

  • Der aktuelle Rechner hat kein Diskettenlaufwerk mehr. Wenn doch, dann ist dieses nur für 3 ½-Zoll-Disketten geeignet.
  • Die Magnetschicht ist aufgrund von Alterungsvorgängen nicht mehr lesbar.
  • Wenn der PC die Diskette lesen könnte, hätte er wahrscheinlich Probleme mit dem Datenformat. Man versuche z.B. einen mit WORD5 (für DOS) geschriebenen Text zu öffnen.

Dieses Beispiel beschreibt einen großen Teil der Probleme, mit denen wir schon jetzt zu kämpfen haben:

  • Neue Hardware ist mit früheren Versionen nicht mehr kompatibel.
  • Unsere Speicher haben eine begrenzte Lebensdauer.
  • Anwenderprogramme können ältere Datenformate nicht richtig interpretieren.

Dieses Beispiel lässt sich auf die Welt der Großrechner übertragen. So berichtete die NASA vor einiger Zeit, dass die Magnetbänder der früheren Mondmissionen (ca. 1968) nicht mehr gelesen werden können, da durch den technischen Fortschritt keine Magnetbandgeräte mit entsprechend niedriger Schreibdichte mehr verfügbar sind.

Es gibt nun verschiedene Möglichkeiten, zumindest die Informationen zu erhalten: Immer wieder genannt werden der Mikrofilm und die Digitalisierung.

Seit 1961 wird z.B. die Mikroverfilmung von Archivalien durchgeführt. Dieses ist eine der Maßnahmen zum Schutz von Kulturgut bei bewaffneten Konflikten gemäß der Haager Konvention. Hierbei handelt es sich ausnahmslos um Archivgut mit Unikatwert und mit besonderer Aussagekraft zur deutschen Geschichte und Kultur. Die Sicherungsfilme werden im Barbarastollen in Oberried bei Freiburg im Breisgau eingelagert. Dies ist nur ein Beispiel.

Die Lebensdauer von Schwarzweißfilmen aus Polyethylen (PET) sowie des Micrograph-Films von Ilford (Cibachrome-Chemie) beträgt mehrere hundert Jahre. Inzwischen digitalisieren immer mehr Bibliotheken ihre Bücher. Diese Digitalisierung erfolgt nicht vordergründig aus Sorge um den Erhalt des kulturellen Erbes, sondern um einer Vielzahl von Nutzern den weltweiten Zugriff auf vorhandenes Wissen im Volltext zu ermöglichen.

Dieser Zugriff erfolgt über das Internet. Im Informationszeitalter ist das Internet als digitaler Informationsspeicher neben die Bibliotheken und Archive getreten.

Das Internet als Informationsspeicher

Das Internet ist das größte Computernetzwerk der Welt. Es wurde Anfang der 1990er Jahre zunächst für militärische Zwecke eingerichtet. Durch die vielen Verzweigungen ist es praktisch nicht vollständig zerstörbar und die Daten suchen sich selbstgesteuert ihren Weg durch das Netz.

Theoretisch können alle Informationen, also Dokumente, Dateien usw., die auf allen Online-Rechnern weltweit liegen, auch von allen anderen Rechnern weltweit genutzt werden. Die Grundlage der Informationsspeicherung im Internet sind Datenbanken.

Um die Größe des Internet zu beschreiben, wird gelegentlich das Bild des "CO2-Fußabdrucks" verwendet. Damit wird die Klimaschädlichkeit von Geräten, Personen oder Systemen illustriert. Der CO2-Fußabdruck aller Rechenzentren weltweit hat inzwischen den des Welt-Luftverkehrs erreicht.

Der Laie glaubt gern, dass das Internet im Prinzip nichts kostet. Die ,New York Times' hat einmal ausgerechnet, dass eine einzelne Suchanfrage bei Google so viel Strom verbraucht, wie eine Energiesparlampe in einer Stunde.

Das Internet wird meistens mit dem World Wide Web gleichgesetzt. Es gibt aber durchaus Internet-Dienste, die nicht in das WWW integriert sind, zum Beispiel E-Mail.

Die Inhalte des WWW kann man grob in dynamische und statische Seiten unterteilen. Dynamische Seiten bieten aktuelle Inhalte für den Nutzer an, z.B. beim Internet-Handel. Statische Seiten haben stabile Inhalte, die sich nicht oder nur selten ändern. Sie entsprechen in gedruckter Form Büchern, Zeitschriften usw. in Bibliotheken und Archiven. Dieses ist der Teil des Internet, der in diesem Zusammenhang interessiert.

Berechtigt ist die Frage nach der Sicherheit des Internet. Es arbeitet mit vielen unabhängigen Informationswegen und dezentraler Speicherung. Informatiker werden ihm eine hohe Sicherheit bescheinigen, aber Fachleute sind meistens optimistisch, was ihre eigenen Hervorbringungen angeht.

Wahrscheinlich lebt das Internet nicht lange genug, um in einigen hundert Jahren noch als Informationsspeicher zu dienen. Selbst wenn diese Prognose nicht zutrifft und das Internet lesbar bleibt, wer soll sich eines Tages in den Tausenden von Petabytes (1015 Byte, 1 Billiarde Bytes) zurechtfinden? Und was kann diese Datenmasse später einmal über unsere Gegenwart aussagen?

Wir haben also ein Mengenproblem. Es ist nicht sinnvoll, alles, was an Daten produziert wird, in die Zukunft zu retten. Es ist daher dringend eine Debatte darüber nötig, was für zukünftige Generationen erhalten werden muss. Hier tritt das Problem auf, vorher zu wissen, was einmal – auch in einem ganz anderen Kontext – später besonders wichtig sein kann.

Es gibt Vorschläge, Informationssammlungen auf besonders langzeitstabilen Trägern (z.B. hochreines Metall oder Glas) an geeigneten Orten mit möglichst geringen Umwelteinflüssen (dazu zählen auch Plünderer) zu lagern. Diese Sammlungen ("Zeitkapseln") dürfen weder durch physische Zerstörung noch durch Vergessenwerden verloren gehen. Es bedarf besonderer Organisationen, deren Selbstverständnis auf Jahrhunderte ausgerichtet ist. Im frühen Mittelalter waren dieses die Klöster, in deren Bibliotheken bis heute sehr alte Dokumente bewahrt werden.

Die Lebensdauer digitaler Datenträger

Ein aktuelles Problem ist die Lebensdauer der zur Verfügung stehenden digitalen Datenträger.

  • Magnetbänder: Bis zu 30 Jahre
    Magnetbänder sind noch immer die wichtigsten Datenträger für die Langzeitarchivierung.
  • Disketten: 5 bis 10 Jahre.
  • Festplatten im Arbeitsplatzrechner (PC): Mehrere Jahre.
  • Selbst gebrannte optische Speichermedien – CD-ROM/DVD: 5 bis 10 Jahre. USB-Stick: Bis zu 10 Jahre.

Wenn Garantien für die Lebensdauer von Datenträgern gegeben werden, gelten diese immer nur für den Datenträger, niemals für die Daten! Das Problem bei elektronischen Speichern ist nicht ob sie ausfallen, sondern wann. Man kann fast sagen: Je neuer das Medium, desto kürzer die Lebensdauer.

Als Ausweg aus diesem Dilemma bietet sich zurzeit nur die Migration an. Darunter versteht man im Rahmen der Informationstechnik den Transfer von Daten aus einer Umgebung in eine andere, sowie das Umstellen von Hardware einer alten Technologie in neue Technologien.

Also: Umkopieren, Umkopieren . . .

Da wegen der steigenden Datenmenge (etwa 30 Prozent pro Jahr) die Speicherkapazität laufend vergrößert werden muss, kann bei dieser Gelegenheit die erforderliche Migration erfolgen.

Geeignete Datenformate

Eine weitere wichtige Frage lautet: Welche digitalen Formate sind für die Langzeitarchivierung geeignet?

Es ist nur möglich Daten zu lesen, wenn ein Programm und ein Betriebssystem vorliegen, das den Inhalt einer Datei "versteht". Da viele Betriebssysteme und Programme ein eigenes (proprietäres) Verfahren einsetzen, um die Daten zu codieren, ist eine Lesbarkeit von Daten nicht mehr gegeben, wenn ein Betriebssystem oder ein Programm nicht weiterentwickelt wird (z.B. DOS → Windows).

Die einfachsten Formate werden die langlebigsten sein. Ungeeignet sind Dateiformate, die im Besitz eines einzelnen Herstellers sind, der sie nach Belieben verändern oder ihre Benutzung einschränken kann, z.B. DOC für Textdateien (Microsoft).

Die Entwicklung und Durchsetzung von technologie-unabhängigen Datenformaten stellt eine der großen Herausforderungen dar. In diesem Zusammenhang wird immer wieder auf die Sprache XML zur Textstrukturierung verwiesen (eXtensible Markup Language).

Mit welcher Strategie retten wir unser digitales Gedächtnis?

Die UNESCO ist sich dieses Problems bewusst und hat es sich zur Aufgabe gemacht, Regierungen in ihren Aktivitäten zur Bewahrung des kulturellen Erbes im digitalen Zeitalter zu unterstützen und zu leiten.

Die UNESCO hat eine Strategie mit folgenden Schwerpunkten zur Förderung der digitalen Bewahrung entwickelt:

  • Etablierung eines möglichst breiten Konsultationsprozesses mit Regierungen, Entscheidungsträgern, Produzenten von Informationen, Kulturerbeeinrichtungen, Experten, der Softwareindustrie sowie Standard-Organisationen,
  • Verbreitung von technischen Richtlinien,
  • Umsetzung von Pilotprojekten

Die 32. Generalkonferenz der UNESCO hat im Oktober 2003 eine "Charta zur Bewahrung des digitalen Kulturerbes" verabschiedet. Zurzeit laufen weltweit eine Vielzahl von Projekten zur Archivierung und Erhaltung digitaler Informationen.

Von den deutschen Projekten soll hier nur "nestor – das Kompetenznetzwerk Langzeitarchivierung" erwähnt werden. Es verfolgt das Ziel, die digitalen Ressourcen in Deutschland zu sichern und verfügbar zu machen sowie mit anderen Netzwerken und Entscheidungsträgern national und international zusammenzuarbeiten, um gemeinsam die digitale Wissensbasis langfristig zu bewahren. Zugleich ist es ein Forum, in welchem sich über Standards und die nachhaltige Übernahme von Daueraufgaben verständigt wird.

Empfehlungen für die Praxis des Photographen

Diese Empfehlungen beziehen sich auf die Langzeitarchivierung.

  • Speichern Sie nur die "wichtigen" Bilder (sonst finden Sie in der Masse gar nichts wieder).
  • Speichern Sie Ihre Bilddateien im TIFF-Format. Bei diesem ist die Wahrscheinlichkeit groß, dass auch in absehbarer Zukunft Programme zur Verfügung stehen, mit denen die Informationen aus den Dateien zurückgewonnen werden können. Völlig ungeeignet sind – trotz der sonstigen Vorzüge – die proprietären RAW-Formate.
  • Sichern Sie Ihre Daten mindestens doppelt:
    1. auf mobilen Festplatten.
    2. auf DVD-Typen, die für langfristige Archivierung empfohlen werden.
  • Kopieren Sie Ihre Daten alle fünf Jahre auf neue Datenträger um.
  • Drucken Sie Ihre wichtigsten Bilder aus. Bei optimalen Tinten/Papier-Kombinationen erhalten Sie gute Ergebnisse. Heutige Inkjet-Drucke sind besser haltbar als C-Prints, insbesondere Drucke mit Pigmenttinten.

Schlußbemerkung

Sie werden festgestellt haben, dass die am Anfang gestellte Frage "Wie retten wir unser kulturelles Erbe?" nicht beantwortet wurde. Dieses ist zurzeit auch gar nicht möglich, denn wir sind erst in einer Phase, uns der Probleme bewusst zu werden.

Hans Brümmer

Quellen:

Philip Wolff: Vor Festplatten und Disketten werden künftige Historiker ratlos sitzen. SZ Wissen 04/2005, S. 84…92

Jürgen Rink: Digitales für die Ewigkeit. Langzeitarchivierung digitaler Inhalte. c't 2005, Heft 22, S. 66…68

V. Risak: Langfristige Informationsspeicherung
http://www.cosy.sbg.ac.at/~risak/dat_prog/doku/lang210503.xhtml

Ute Schwens, Hans Liegmann: Langzeitarchivierung digitaler Ressourcen
http://www.langzeitarchivierung.de/downloads/digitalewelt.pdf

Informatiklexikon, Langzeitarchivierung http://www.gi-ev.de/service/informatiklexikon/informatiklexikon-detailansicht/meldung/126/

nestor - Kompetenznetzwerk Langzeitarchivierung
http://www.langzeitarchivierung.de/index.php