Referat Infrastrukturen und digitale Grundsatzfragen

Digitale Langzeitarchivierung (DLZA)

Die Materialien, die im Archiv der sozialen Demokratie bewahrt werden, liegen in zunehmendem Maß in digitaler Form vor. Es handelt sich bei den Objekten sowohl um digital borns, wie auch um Digitalisate. Im digitalisierten wie auch im originär digitalen Bereich reicht die Breite der Objekttypen von Text über Bild, Ton und Bewegtbild bis zu zusammengesetzten Objekttypen wie Webseiten. Das gilt für Archiv- wie Bibliotheksgut gleichermaßen, ob es sich um die Unterlagen von Hinterleger_innen oder die Publikationen der Friedrich-Ebert-Stiftung handelt, die in der Digitalen Bibliothek verwaltet werden.

Die beiden großen Herausforderungen bei der Archivierung digitaler Inhalte bestehen zum einen darin, die Interpretierbarkeit der Daten zu erhalten, zum anderen die Authentizität und Integrität der Quellen zu gewährleisten. Bei der Umsetzung seines digitalen Archivs orientiert sich das AdsD an den Standards, die von der Fach-Community entwickelt worden sind, allen voran das Referenzmodell Open Archival Information System (OAIS).

Das digitale Archiv als System ist im Wachsen begriffen und wird dauerhaft einem ständigen Prozess der Beobachtung und Überarbeitung unterliegen. Entsprechend werden auch die hier dargestellten Bereiche und Dokumente erweitert und regelmäßig überarbeitet werden. Teilweise werden für die Aufbereitung von Daten eigens entwickelte Skripte verwendet, diese werden über den GitHub-Account des Teams zur Verfügung gestellt.

Speicher

Die Basis für den Erhalt der digitalen Objekte ist, die ihnen zugrundeliegenden Bitströme korrekt zu bewahren. Dafür werden diese Objekte mehrfach redundant gespeichert, wobei sich eine Kopie an einem geographisch anderen Ort befindet. Die Korrektheit der erhaltenen Kopien wird über Prüfsummen gesichert.

Digitale Übernahme (Pre-Ingest und Ingest)

Im Bereich der Digitalen Übernahme arbeiten das Referat Sammlungsprofil und Überlieferungsbildung und das Referat IdG eng zusammen, wobei das Referat IdG v.a. bei den technischen Aspekten der digitalen Übernahme unterstützt. Die Übernahme besteht aus einem vorbereitenden Teil (Pre-Ingest), in dem die Daten für die Archivierung aufbereitet werden und dem tatsächlichen Ingest in das Langzeitarchivierungssystem.

Bislang übernommen werden insbesondere Schriftgut aus Fileablagen, audiovisuelle Materialien von Hinterleger_innen sowie Web-Inhalte. Der Workflow für die Übernahme von Schriftgut aus Fileablagen wird in diesem Blogbeitrag beschrieben. Der spezielle Fall der Übernahme von Web-Inhalten wird hier erläutert. Wenn die Software auf Seiten von Hinterleger_innen es erfordert, werden weitere Workflows zur Übernahme aus den jeweiligen  Systemen folgen. Neben diesen Übernahmen von Hinterleger_innen werden auch die Ergebnisse der Digitalisierung für die Digitale Langzeitarchivierung vorbereitet.

Beim Pre-Ingest liegt ein besonderes Augenmerk auf der Formaterkennung. So wird sichergestellt, dass die Information vorliegt, welche Formate sich im digitalen Archiv befinden. Sind defekte Dateien unter den übernommenen Daten, wird versucht, sie vor dem Ingest zu reparieren. Alle  Veränderungen an Daten werden dokumentiert und alle Kopiervorgänge durch Verwendung von Hashfunktionen abgesichert. Als Abschluss des Pre-Ingest-Prozesses werden Submission Information Packages (SIP) gebildet nach dem Standard eCH-0160 für Schriftgut bzw. BagIts im AV-Bereich.

Die SIPs können anschließend über das Archivinformationssystem Scope in das Repository Fedora Commons eingespeist werden (Ingest). Die SIPs werden dabei nach vordefinierten Regeln in Archival Information Packages (AIP) umgewandelt. Während des Ingests werden für festgelegte Formate Migrationen in archivfähige Formate vorgenommen. Die Originale bleiben ebenfalls erhalten. Alle Vorgänge während des Ingests werden automatisch unter Verwendung des Metadatenstandards PREMIS dokumentiert.

Erhaltungsplanung

Grundsätzlich setzt das AdsD bei der digitalen Archivierung auf die Migrationsstrategie. Dazu wird bewertet, inwiefern die Formate, die ins Archiv übernommen werden sollen oder sich bereits dort befinden, als archivfähig gelten. Archivfähige Formate sind solche, bei denen davon auszugehen ist, dass sie auf längere Sicht möglichst ohne proprietäre Software interpretierbar bleiben. Müssen Formate migriert werden, können dabei nicht immer alle Eigenschaften erhalten bleiben, die eine Datei ursprünglich hatte. In diesem Fall muss entschieden werden, welche dieser Eigenschaften als signifikant definiert werden, also (wenn möglich) erhalten werden sollen.

Um festzulegen, welche Eigenschaften für bestimmte Objektgruppen als signifikant verstanden werden, verwendet das AdsD das Modell der Designated Communities, also der Nutzungsgruppen, für die die Objekte erhalten werden. Abgeleitet von den aktuellen und zukünftig erwarteten Interessen dieser Nutzungsgruppen sind bereits für einige Objektgruppen signifikante Eigenschaften definiert worden. Auch diese Definition ist im Wachsen begriffen.

nach oben