| |
Mit dem Komplex Langzeitarchivierung sind wir nun an der Stelle des Schemas angekommen, die in der Grafik mit Sicherung überschrieben ist.
Unser Archivobjekt befindet sich im Archiv, d.h. in der Regel auf einem Server oder der Festplatte eines PC, ist bereits bearbeitet, erschlossen und verzeichnet und muss nun inklusive der Metadaten sowie der Erschließungsdaten auf Dauer gesichert werden.
Was heißt Langzeitarchivierung digitaler Daten?
- Unter Langzeitarchivierung versteht man die Erfassung und langfristige Aufbewahrung von in digitaler Form vorliegenden Informationen. Meist wird auch das dauerhafte Zur-Verfügung-Stellen dazu gerechnet.
In Bezug auf die Webseiten ist zu beachten, dass sowohl der authentische Informationsgehalt der digitalen Ressource ebenso aber auch die originale Fassung, das Layout zu erhalten sind.
Um drohenden Informationsverlust zu vermeiden, sind insbesondere die begrenzte Haltbarkeit der Trägermedien, der schnelle Medien- und Systemwandel, aber auch urheberrechtliche Beschränkungen zu berücksichtigen.
- Die technische Entwicklung kreiert immer neue digitale Dateiformate. Diese sind fast immer an spezielle Programme, bestimmte Rechnertypen und bestimmte Betriebssysteme gebunden. Das birgt die große Gefahr, das ältere Daten mit aktualisierter Hard- und Software nicht mehr lesbar sind. Aufgabe ist es also, eine technische Lösung für eine zuverlässige und dauerhafte Archivierung zu finden, die nicht nur die digitalen Daten bewahrt, sondern sie auch verfügbar und in der Zukunft lesbar hält.
- Das Bewahren digitaler Daten beginnt mit dem Speichern, d.h. ein bestimmtes Programm, das auf einem bestimmten Rechner unter einem bestimmten Betriebssystem arbeitet, speichert die Datei in einem bestimmten Dateiformat auf ein bestimmtes Speichermedium. Jede Datei hat also ihre eigene Entstehungsumgebung mit einer Vielzahl einzelner Komponenten, die wechselseitig voneinander abhängen.
Um die gespeicherte Datei vom verwendeten Speichermedium wieder verfügbar zu machen, braucht man ein bestimmtes Lesegerät, das wiederum mit einem bestimmten Betriebssystem zusammenarbeitet. Diese Nutzungsumgebung besteht wie die Entstehungsumgebung aus der gleichen Vielzahl einzelner Komponenten, die auch wieder wechselseitig voneinander abhängen.
Sind Entstehungs- und Nutzungsumgebung identisch, lassen sich gespeicherte Dateien problemlos lesen. Ändern sich eine oder mehrere der Komponenten, sinkt die Wahrscheinlichkeit, die Datei zukünftig nutzen zu können. Und die Veränderung der Komponenten ist vorprogrammiert, weil sich Formate, Programme, Betriebssysteme und Technik ziemlich rasant weiter entwickeln.
- Um die Sache noch etwas zu verkomplizieren, kommt noch ein weiterer Aspekt hinzu: Digitale Bilder, elektronische Dokumente oder Akten liegen in der Regel nur in einem oder wenigen Formaten vor. Die gespiegelten Webseiten bestehen dagegen aus vielen unterschiedlichen Dateiformaten, die mit einer Vielzahl unterschiedlicher Programme angezeigt werden, die wiederum miteinander funktionieren müssen. Und diese müssen auch nach einer Emulation oder Migration noch funktionieren. Mikroverfilmung als Maßnahme zur langfristigen Sicherung einer elektronischen Akte mag vielleicht noch sinnvoll sein.
Für Webseiten scheidet das Medium Mikrofilm als Sicherungsmaßnahme jedoch aus. Deren Funktionalität, die ja ganz wesentlich für dieses Archivobjekt ist, ist in dem Medium Film nicht mehr gegeben!.
Das ist, in aller Kürze geschildert, unser Problem!
In der Praxis sieht die LA bisher so aus, dass wir, also die an diesem Projekt beteiligten Archive, die Daten auf einem Server oder einer Festplatte halten und täglich, bei einigen nur wöchentlich, ein Backup auf Band gesichert wird. Vereinzelt werden zusätzliche Sicherungen auf CD oder DVD gebrannt.
Aufgrund der großen Datenmenge wird von allen Archiven eine Serverlösung mit Raid-System und Bandsicherung favorisiert. Bisher war es noch nicht notwendig und sicherlich auch noch nicht möglich, bezüglich der gespiegelten Webseiten die verschiedenen Methoden der LA wie Migration und Emulation einzusetzen. Darüber können wir deshalb nicht aus der Praxis, sondern nur etwas theoretisch berichten.
Für den heutigen Workshop haben wir das Thema LA so aufgeteilt, dass Frau Antje Scheiding/Bertelsmann AG zu den Dateiformaten, den Speichermedien und Speicherverfahren und Frau Margareta Peters/AdsD zu den Methoden der LA referieren.
Wir haben versucht,
- wenigstens die gängigsten Dateiformate zu beschreiben und einzuordnen
- gesicherte Informationen über die Langlebigkeit von Medien zu eruieren
- die Konvertierung in gesicherte Formate zu behandeln: Dabei stellt sich die Frage, welche Formate sind das? Wer bestimmt, was sichere Formate sind? Was heißt das für uns? Bedeutet das z.B., dass bei einer Konvertierung jeder Link neu geschrieben werden muss? Und wenn ja, gibt es dann dafür automatische Verfahren?
- Welche Methoden der LA, welche Migrationsverfahren gibt es, welche Migrationsstrategie kann empfohlen werden? Wie könnte und sollte ein langfristiges Speicherkonzept aussehen?
Frau Scheiding, Sie haben das Wort. |