Geschichte

Ansprechpartner

PD Dr. Stefan Müller

0228 883-8068

Stefan.Mueller(at)fes.de 

Abteilung

Archiv der sozialen Demokratie

 

World Digital Preservation Day! Welttag der digitalen Erhaltung!

Bild: Welttag Digitale Erhaltung

Bild: Versandhaus Quelle, Datenverarbeitung mit Computer IBM Typ 701, 1958; Rechte: J.H. Darchinger/Friedrich-Ebert-Stiftung.

Am 4. November 2021 ist der Welttag der digitalen Erhaltung ausgerufen – der World Digital Preservation Day. Der WDPD findet immer am ersten Donnerstag im November statt und will auf die Notwendigkeit hinweisen, dass wir uns jetzt schon damit beschäftigen müssen, wie wir digitale Daten geeignet aufbewahren, damit uns diese Daten nicht aus Versehen unwiederbringlich verloren gehen.

Die Arbeit, die dazu notwendig ist, ist eine noch eher junge archivarische Disziplin mit einer eigenen Fachsprache. Das macht die Verständigung zwischen dieser Disziplin und ihrer Umwelt nicht immer einfach. Der WDPD hat deshalb das Motto „Breaking Down Barriers“: Wir digitalen Erhalter_innen sollen und wollen Barrieren abbauen und unsere Arbeit verständlich machen.

Hier soll deshalb ein kleiner, praktischer Ausschnitt der Alltagsarbeit in der digitalen Erhaltung beschrieben werden. Dieser Blogbeitrag schaut sich dabei nur die technische Seite an (und davon auch nur einen Ausschnitt) an und ist als Werkstattbericht, nicht als idealtypische Schilderung zu verstehen.

Nehmen wir an, eine Person, die eine wichtige Position in einer Organisation innehatte, übergibt uns (wahrscheinlich zusammen mit einer ganzen Menge Papier) auch eine Festplatte. Darauf finden sich Fotos, Protokolle und Korrespondenz aus der Arbeit in dieser Organisation, die wir aufbewahren wollen.

Was machen wir damit?

Eine grundlegende Maßnahme, um digitale Daten zu sichern, kennen wohl alle: das Back-up. Wir legen also mehrere Kopien der Dateien auf der Festplatte an – so dass, falls eine der Kopien aus welchem Grund auch immer nicht mehr zugänglich ist, noch andere zur Verfügung stehen. Darin besteht nämlich der große Vorteil des Digitalen gegenüber dem Analogen in Bezug auf die Archivierung: Die Möglichkeit der exakten Kopie. Von einer Papierakte kann ich zwar Kopien machen, die werden aber niemals exakt wie das Original sein. Während im digitalen Bereich die Bedeutung von „Echtheit“ entkoppelt ist von dem Speichermedium auf dem die Bits liegen.

Gleichzeitig können digitale Objekte aber auch sehr viel einfacher manipuliert werden als analoge Objekte, ohne dass diese Manipulation danach noch ersichtlich ist. In einem mit Schreibmaschine geschriebenen lässt sich nicht so einfach noch ein Wort einfügen wie in einem Word-Dokument. Die Frage, ob eine Quelle „echt“ ist, also vollständig so, wie der Text ursprünglich geschrieben worden ist oder die Fotografie aufgenommen wurde, bleibt deshalb relevant und wird schwerer nachzuvollziehen.

Technik allein ist hier nicht die Lösung, aber kann diesen Prozess unterstützen. Dazu werden zu den gespeicherten Dateien gleichzeitig Prüfsummen angelegt. Prüfsummen werden auch gern als Fingerabdruck bezeichnet, weil sie eine Datei eindeutig identifzieren – wenn auch nur ein Bit in der Dateispeicherung sich verändert, verändert sich der Fingerabdruck vollständig. Auf dem Bild sieht man als Beispiel zwei sehr simple Text-Dokumente, die nur den Text „Das ist das einfache Dokument“ enthalten – einmal mit und einmal ohne Punkt am Ende des Satzes. Darunter sieht man jeweils die mit dem Algorithmus SHA-256 errechnete Prüfsumme für die beiden Dokumente. Die beiden Prüfsummen sind trotz der minimalen Änderung völlig unterschiedlich.

So lässt sich nachprüfen, ob sich eine Datei verändert hat, egal ob willentlich oder versehentlich, verursacht durch Technik oder einen Menschen. Prüfsummenbildung und -vergleich sind deshalb Routineaufgaben, die die Arbeit in der digitalen Erhaltung ständig begleiten.

Die Dateien sind nun also mehrfach gespeichert und dank der Prüfsummen können wir regelmäßig testen, ob sie noch korrekt sind und andernfalls aus den Kopien ersetzen. Leider heißt das noch lange nicht, dass die Daten auch langfristig lesbar bleiben. Digitale Daten sind für den Menschen erst verständlich, indem sie durch Computer interpretiert werden.

In unserem Beispiel haben wir auf der Festplatte v.a. Fotos und Textdokumente. Bei solchen Dateien ist eine gute Möglichkeit zur digitalen Erhaltung, sie in Formaten zu speichern, die voraussichtlich langfristig verwendet werden. Dazu müssen wir aber erstmal wissen, welche Formate überhaupt vorliegen. Dazu werden zunächst die Formate identifiziert. Dazu gibt es Tools wie z.B. Droid, mit Hilfe derer man erkennen, welche Formate auf einer Festplatte oder in einem Ordner enthalten sind.

Wenn wir die Formate kennen, müssen wir entscheiden, ob sie geeignet sind für die Langzeitarchivierung. Einige Formate werden vor der Ablage im Archiv in ein geeigneteres Format überführt. Textdokumente konvertieren wir z.B. in PDFs, in einer spezifischen, genau für den Archivzweck entwickelten Form.

Die „Originale“, also: die Dateien vor der Konversion, bewahren wir übrigens i.d.R. ebenfalls auf. Und natürlich dokumentieren wir, was wir da tun. Denn wir müssen ja für die Menschen, die (irgendwann) in der Zukunft diese Quellen nutzen wollen, nachweisen, dass die Veränderungen an diesem Dokument mit Absicht geschehen sind und der Bitstream zwar nicht mehr derselbe ist, aber z.B. bei einem Textdokument immer noch derselbe Inhalt und dasselbe Layout erhalten geblieben sind. Auch hier merkt man: Es ist nicht die Technik allein, die die Authentizität einer Quelle sichern kann.

Mit redundanter Speicherung, Prüfsummenbildung, Formatvalidierung und ggf. -konvertierung und Dokumentation sind technische Grundlagen für die digitale Erhaltung gelegt. Damit ist es aber nicht getan – die Inhalte dieses Systems müssen immer weiter beobachtet werden, die Daten im System müssen geordnet und beschrieben werden, damit man Dinge wieder findet und Strukturen erhalten bleiben, das Wissen über die Systeme muss weitergegeben werden… Ein echt langfristiges digitales Archiv ist nur in einem komplexen Zusammenwirken von Menschen und Maschinen möglich.

Wer tiefer in das Thema einsteigen möchte, findet auf der Seite von nestor, dem Kompetenznetzwerk für digitale Langzeitarchivierung, eine hilfreiche Linksammlung. Und wer sich für die Frage interessiert, wie man seine privaten digitalen Materialien sichern kann, findet hier Tipps.

Annabel Walz


Deutsche Gewerkschaften und Grundgesetz, 1945–1949. Teil 1: Vom Wiederaufbau zum Tarifvertragsgesetz.

weitere Informationen

Demokratischer Sozialismus: Das georgische Experiment

weitere Informationen

Unbesungene Helden: Ukrainischer Widerstand und ukrainische Dissidenten

weitere Informationen