Megabytes und Kilobytes statt laufender Meter

Langzeitarchivierung – Archivierung und Dokumentation digitaler Metadaten und Objekte

Mike Zuchet

Das Archiv der sozialen Demokratie hat in den letzten Jahren damit begonnen, digitale Metadaten und Dateien zu übernehmen und für deren Aufbereitung und Import in das Archivdatenbanksystem Faust 5.0 professional zu sorgen. Im Rahmen eines Vortrags in der Fachgruppe 6 auf dem 77. Deutschen Archivtag in Mannheim 2007 wurden dabei auftretende Fragen und Lösungsansätze an drei praktischen Beispielen vorgestellt. Oberste Prämisse in allen Fällen war, zunächst nur die bestehenden Hard- und Softwareressourcen einzusetzen, über die das AdsD verfügt, um von den auftretenden Defiziten neue Anforderungen an Hard- und Software abzuleiten und damit auch in Zukunft der Aufgabenstellung gerecht zu werden. Sofern es sich um Freeware-Tools handelt, kamen auch diese zum Einsatz. Dies betraf die Bereiche der Integritätsprüfung und -gewährleistung. In einem dritten Beispiel wurden wieder digitale Dateien und Metadaten übernommen, allerdings lagen letztere in einer differenzierten und komplexeren Struktur vor.

Beispiel A

Übernahme digitaler Metadaten zu Altakten der Gewerkschaft Öffentliche Dienste, Transport und Verkehr (ÖTV) Bezirk NW II aus Datenbanksystem BISMAS und Transfer in Archivdatenbanksystem Faust 5.0 professional des AdsD sowie Gewährleistung der Datenintegrität

Im Jahr 2004 schloss das AdsD einen Vertrag und eine Projektvereinbarung mit dem Landesbezirk NRW der Vereinten Dienstleistungsgewerkschaft (ver.di) ab, wonach die Altakten der Gewerkschaft Öffentliche Dienste, Transport und Verkehr (ÖTV) Bezirk NW II übernommen, technisch bearbeitet und in den Magazinräumen aufgestellt werden sollten. Zudem verpflichtete sich das AdsD dazu, die digitalen Metadaten zu Altakten der o.g. Gewerkschaft aus dem Datenbanksystem BISMAS1 zu übernehmen und in das Archivdatenbanksystem Faust 5.0 professional zu transferieren. Wenngleich dem Datenbanksystem BISMAS grundsätzlich ein relationales Datenmodell zugrunde liegt, waren für die bevorstehenden Arbeiten keine tief eingreifenden Änderungen an der Datenbankstruktur notwendig. Da die Datenbasis in einer ein-dimensionalen Relation vorlag, musste keine Denormalisierung durchgeführt werden, die den Arbeitsaufwand erheblich vergrößert hätte.2

Nachdem sowohl Konsistenz als auch Integrität der Datenbank gewährleistet waren, wurde die entsprechende Datenbasis über eine programmierbare Schnittstelle im Ausgabeformat Feldstruktur exportiert und lag anschließend als ANSI-Textdatei vor. Anschließend wurde diese Metadaten-Exportdatei mit Hilfe verschiedener Programme des Microsoft-Office-Pakets aufbereitet, wobei bereits die Auswahl des Ausgabe- und Dateiformats im Hinblick auf den späteren Import in das Archivdatenbanksystem des AdsD gewählt wurden.

In einem nächsten Schritt wurde der Faust-Importfilter so eingestellt, dass die Quellfelder der generierten Metadaten-Exportdatei mit den entsprechenden Zielfeldern in der Faust-Datenbank synchronisiert wurden. Anschließend erfolgte der Import der Metadaten-Exportdatei in das Archivdatenbanksystem des AdsD. Das Ergebnis war eine komplette Faust-Dokumentation mit insgesamt 1698 Datensätzen, dessen Inhalt sich aus der Datenbasis der ursprünglichen Datenbank BISMAS zusammensetzte. Da Faust 5.0 professional wiederum über entsprechende Exportschnittstellen verfügt, ist auch gewährleistet, dass bei einem eventuellen Systemwechsel die besagte Datenbasis des Bestands ÖTV NW II in zukünftige Datenbanksysteme transferiert werden kann und recherchierbar bleibt. Die Altakten sind technisch bearbeitet und in den Magazinräumen des AdsD aufgestellt worden. Der Zugang erfolgt über das Archivdatenbanksystem oder konventionelle Findbücher.

Wie oben bereits angedeutet, wurde für die Überprüfung der Datenintegrität ein spezielles Freeware-Tool hinzugezogen: EF CheckSum Manager 4.50. Um Manipulationen an der übernommenen Datenbasis – ob gewollt oder ungewollt – in jedem Fall nachvollziehen zu können, wurden von sämtlichen Datenbankdateien, die die Faust-Dokumentation bilden, entsprechende MD5-Prüfsummen (alphanumerischer 128-Bit-Hashwert, 32stellig) mit Hilfe des Programms EF CheckSum Manager 4.50 generiert (Beispiel für eine MD5-Prüfsumme: 645480e8b39be3d2d6d92be64863da0c). Jede dieser MD5-Prüfsummen wurde auf einer CD-R, einem WORM-Medium, gespeichert und in einem Protokollordner zusammengefasst, um Änderungen ausschließen zu können. Sollten in einem der insgesamt 1698 Datensätze nur kleinste Veränderungen vorgenommen werden, hätte dies Rückwirkungen auf die Faust-Datenbankdateien, die MD5-Prüfsummen würden sich ändern und ein Abgleich der Referenz-MD5-Prüfsumme mit den neu generierten Prüfsummen ließe den Schluss auf einen Eingriff in die besagte Datenbasis zu. Allerdings sind weder quantitative noch qualitative Aussagen über die vorgenommenen Änderungen auf der Basis dieses Sicherungsmechanismus möglich. Um dennoch feststellen zu können, welche Änderungen eingetreten sind, wird folgendes Procedere durchgeführt: Aus dem Archivdatenbanksystem Faust wird eine Metadaten-Exportdatei – Sekundärdatei – generiert, der das identische Ausgabe- und Dateiformat zugrunde liegt wie der Metadaten-Exportdatei – Masterfile – aus dem Datenbanksystem BISMAS. Anschließend werden Masterfile und Sekundärdatei mit Hilfe des Freeware-Tools Idoswin Pro zeilenweise miteinander verglichen. Für den Fall, dass Abweichungen auftreten, werden diese entsprechend hervorgehoben. Mit diesen Informationen ist es möglich, direkt auf den betroffenen Datensatz / die betroffenen Datensätze zuzugreifen und Änderungen wieder rückgängig zu machen.

Es ist beabsichtigt, in einem näher zu bestimmenden automatisierten Turnus die jeweiligen MD5-Prüfsummen generieren zu lassen, um die Daten- resp. Datenbankintegrität sowie Revisionssicherheit sowohl dem Hinterleger als auch dem Benutzer gegenüber zu gewährleisten. Der erwähnte Protokollordner enthält neben den MD5-Prüfsummen sämtliche Dateien, die alle wesentlichen Prozesse, die die Metadaten durchlaufen haben, dokumentieren. Die Funktionalitäten von Prüfsummen wurden auch dafür eingesetzt, um sicherzustellen, dass beim Transfer des Datenbanksystems BISMAS vom Hinterleger (ver.di-Landesbezirk NRW) auf einen mobilen Datenträger und von dort auf die Netzlaufwerke des AdsD die Dateiintegrität nicht beschädigt wurde.3 Dazu wurden vor jedem Transferschritt von sämtlichen Dateien, die den BISMAS-Datenbankausschnitt ÖTV NW II konstituieren, MD5-Prüfsummen generiert. Dabei dienten die zuerst generierten Prüfsummen als Referenzprüfsummen. Nach jedem Transferschritt wurden die neugebildeten Prüfsummen mit den Referenzprüfsummen abgeglichen, um Fehler beim Kopiervorgang nachhalten und entsprechende Gegenmaßnahmen treffen zu können.

Für den Fall, daß eine Prüfsumme nach einem Transferschritt von der Referenzprüfsumme abweicht, würde der Transferschritt unter den gleichen Soft- und Hardwarebedingungen noch einmal wiederholt werden. Bliebe die Differenz bestehen, würde das Hauptaugenmerk zuerst auf die physischen Datenträger gerichtet. Aus praktischen Gründen käme ein neue mobiler Datenträger zum Einsatz, falls es bei der Transferreihenfolge "Hinterleger - mobiler Datenträger des AdsD" zu Unstimmigkeiten gekommen ist. Falls auch in diesem Fall keine Änderung einträte, würden die Datenträgersysteme des Hinterlegers und des AdsD mit entsprechenden Diagnose-Tools überprüft, um die Fehlerquelle lokalisieren zu können.4 Abgesehen von der hardwaretechnischen Perspektive wäre es natürlich auch möglich, daß die benutze Software zur Generierung der MD5-Prüfsumme nicht mehr fehlerfrei funktioniert. Um dies feststellen bzw. ausschließen zu können, würde eine neue Software eingesetzt, die nach dem gleichen Algorithmus MD5-Prüfsummen generiert. Bislang ist ein solches Szenario noch nicht eingetroffen, aber mit den aufgezeigten Methoden wird es sehr wahrscheinlich sein, dem Fehler ausfindig zu machen.

Sämtliche Planungen und Implementierungen sind vor dem Hintergrund des OAIS-Referenzmodells (OAIS steht für Open Archival Information System, ISO-Standard 14721:2003) gemacht worden, um a) notwendige Schritte bei der Bewältigung dieser Aufgabe identifizieren zu können, b) dem Hinterleger zu versichern, dass sämtliche Schritte anhand eines international anerkannten ISO-Standards durchgeführt werden und c), dass damit die Basis für die Anerkennung in einem zukünftigen Zertifizierungsprozess geschaffen wird. Im folgenden werden einige Termini des OAIS-Referenzmodells und deren praktische Konkretisierung angeführt, allerdings ohne den Anspruch auf Vollständigkeit. Der gesamte Prozess der ´Eingangsbearbeitung´ – u.a. Übernahme der BISMAS-Datenbank, Auf- und Vorbereitung der Datenbasis, Konfiguration der Faust-Importfilter und Import – wird im OAIS-Referenzmodell als Ingest bezeichnet, die eigentliche Datenbasis als Submission Information Package (SIP), als ´Einlieferungspaket´. Nach dem erfolgreichen Import übernimmt das Archivdatenbanksystem Faust 5.0 professional das Data Management, die Metadatenverwaltung, und stellt zugleich das Retrieval-Instrument dar, über das der Zugriff, der Access, auf die Metadaten des Bestands möglich ist. In diesem Falle liegen die Altakten der ÖTV NW II, das Archival Information Package (AIP), noch in konventioneller Form vor und lagern in den AdsD-Magazinräumen. Analog zum vorangegangenen ist dies das Archival Storage, die Objektspeicherung. Wenngleich das OAIS-Referenzmodell in erster Linie beim Aufbau von Archiven für digitale Überlieferungen hinzugezogen wird, ist es ebenso auf Archive mit konventionellem Archivgut hin anzuwenden. Gerade das vorgestellte Beispiel verdeutlicht dies.

Zusammenfassend seien die durchgeführten Schritte noch einmal aufgeführt: 1. Aufbereitung der Datenbasis in Datenbank BISMAS, 2. Generierung der Metadaten-Exportdatei im Datenformat Feldstruktur, 3. Aufbereitung der Metadaten-Exportdatei mit Microsoft-Office-Programmen, 4. Import der Metadaten-Exportdatei nach Faust 5.0 professional, 6. Generierung MD5-Prüfsummen von Datenbankdateien der Archivdatenbanksysteme Faust und BISMAS zwecks Gewährleistung der Datenintegrität.

Beispiel B

Übernahme digitaler Metadaten und Dateien des Bundesvorstandes der Gewerkschaft der Polizei (GdP) aus Dokumentenmanagementsystem (DMS) ELO office 6.0 und Transfer in Archivdatenbanksystem Faust 5.0 professional des AdsD – flache Metadatenstruktur

Das zweite vorgestellte Beispiel betrifft einerseits wieder die Übernahme digitaler Metadaten, andererseits liegen die dazugehörigen Dokumente – das SIP – ebenfalls in digitaler Form vor. Sowohl die Metadaten als auch die Überlieferungen stammen aus dem Dokumentenmanagementsystem ELO office 6.0, mit dem der Bundesvorstand der Gewerkschaft der Polizei (GdP) arbeitet. Zwecks eines besseren Verständnisses seien einige Strukturmerkmale des DMS angeführt. Das DMS ELO office 6.0 ist in vier Ebenen gegliedert: Aktenschrank – Ordner – Register – Dokumente. Einzelne Vorgänge können durch virtuelle Verknüpfungen von Dokumenten gebildet werden, was sich in den Metadaten niederschlägt. Als Schwierigkeit erwies sich der Umstand, dass zu jedem aus dem DMS exportierten digitalen Dokument (pro Ebene) eine entsprechende Metadaten-Exportdatei generiert wurde, und kein Aktenplan in der Gliederungsstruktur des DMS abgebildet ist, wenngleich es entsprechend konfigurierbar ist. Da die Metadaten aus der Ebene stammen, in der ebenfalls das digitale Dokument liegt, wird dies als flache Metadatenstruktur bezeichnet.


Benutzeroberfläche ELO 6.0 office Gliederungsstruktur ELO 6.0 office

Nachdem seitens des Bundesvorstandes der GdP ein bestimmter Pool von digitalen Dokumenten für die testweise Übernahme ins AdsD genehmigt war, wurden vor Ort und noch vor dem Dateitransfer auf den mobilen AdsD-Datenträger die jeweiligen MD5-Prüfsummen und Metadaten-Exportdateien generiert. Die MD5-Prüfsummen stellten für den weiteren Verlauf die Referenz-Prüfsummen dar. Nach dem Dateitransfer auf den AdsD-Datenträger wurden erneut von jedem einzelnen digitalen Dokument MD5-Prüfsummen (hier: MD5-Prüfsumme 2) erzeugt und diese zusammen mit den Referenz-Prüfsummen in eine Excel-Tabelle importiert und dort miteinander verglichen. Da keine Unterschiede auftraten, konnte sicher davon ausgegangen werden, dass während des ersten Dateitransfers keine Veränderungen oder Schädigungen stattgefunden haben. Die Datenintegrität war also bis zu diesem Zeitpunkt gewährleistet, der Bitstream vollständig erhalten. Wären Differenzen bei den Prüfsummen aufgetreten, würde das in Beispiel A skizzierte Procedere durchgeführt werden, um die Fehlerquelle lokalisieren zu können.
Wie im ersten Beispiel werden die MD5-Prüfsummen der verschiedenen Stadien in einem Protokollordner auf einer CD-R gespeichert. In einem noch näher zu bestimmenden automatisierten Turnus werden entsprechende Abgleiche aus bereits oben genannten Gründen durchgeführt. Auch in diesem Falle sind sämtliche relevanten Dateien in einem Protokollordner zu finden.

Für den späteren Import nach Faust 5.0 professional war es notwendig, sämtliche Metadaten-Exportdateien zu einer Metadaten-Exportdatei zu vereinen und dabei sicherzustellen, dass keinerlei Informationen verloren gehen. Wie im vorangegangenen Fall wurden das Ausgabeformat Feldstruktur und Dateiformat TXT sowie der ANSI-Zeichensatz gewählt, da sich diese Konstellation als zuverlässig und unproblematisch erwiesen hatte.

Der Faust-Importfilter wurde entsprechend eingestellt – Synchronisation der Quell- und Zielfelder – und die aufbereitete Metadaten-Exportdatei in das Archivdatenbanksystem transferiert. Das Ergebnis war eine Faust-Dokumentation, deren Inhalt sich aus den übernommenen Metadaten des DMS ELO office 6.0 zusammensetzte. Anschließend wurden die digitalen Dokumente in einem speziellen Bereich eines AdsD-Server-Laufwerks gespeichert. Anschließend fand wieder eine Bestimmung der MD5-Prüfsummen statt (hier: MD5-Prüfsumme 3), die in die besagte Excel-Tabelle importiert und mit den bereits vorhandenen Prüfsummen abgeglichen wurde. Auch dieses Mal ergaben sich keine Differenzen. Neben der Gewährleistung der Datenintegrität eignen sich Prüfsummen auch dazu, Redundanzen zu vermeiden und ihre Eigenschaften bei der Bewertung und Kassation von digitalen Überlieferungen einzusetzen. Derzeit wird dazu ein Set von Kriterien entwickelt, wobei die Prüfsummenbildung einen wichtigen Baustein bildet.5 Im nächsten Schritt wurden die dateiinternen Metadaten (u.a. Dateigröße, Erstellungsdatum, Dateiformat und -version) der zu archivierenden digitalen Dokumente in die gleiche Faust-Dokumentation importiert, mit dem Ergebnis, dass wiederum exakt die gleiche Anzahl von Datensätzen generiert wurde.6 Diese 100prozentige Redundanz an Datensätzen rührt daher, dass die Version Faust 5.0 professional noch nicht dazu in der Lage ist, bereits bestehende Datensätze um weitere Daten zu ergänzen, sondern statt dessen neue Datensätze anlegt. Die Nachfolge-Version Faust 6 beherrscht diese Funktionalität. Um nun diejenigen Datensätze miteinander zu verknüpfen, die für ein und dasselbe digitale Dokument stehen, wurden zwischen fest definierten Datensatzfeldern – auf der Basis des gleichen Index – horizontale Referenzketten gebildet.7 Bildete der Datensatz, der aus der aufbereiteten Metadaten-Exportdatei des DMS generiert wurde, den Anfang der Referenzkette, schließt sich daran der Datensatz an, der sich aus den dateiinternen Metadaten des digitalen Dokuments zusammensetzt. Am Ende der Referenzkette steht das entsprechende digitale Dokument, das über einen Faust-internen Viewer angezeigt werden kann. Es wurde nicht in das Archivdatenbanksystem übernommen, sondern eine Referenz weist vom Datensatz zum digitalen Dokument hin – Object Linking. Derzeit laufen erfolgreiche Versuche mit anderen Datenbanksystemen, die dazu in der Lage sind, das digitale Objekt zusammen mit den Metadaten zu integrieren – Object Embedding. Anhand der Ergebnisse werden Vor- und Nachteile der Referenz- bzw. Integrationslösung für die Praxis gegeneinander abgewogen.

Auch hier seien die durchgeführten Schritte noch einmal zusammengefasst: 1. Generierung und Aufbereitung der Metadaten-Exportdatei aus dem DMS, 2. Import der Metadaten-Exportdatei nach Faust 5.0 professional, 3. Generierung MD5-Prüfsummen auf GdP-Laufwerk: Referenz-Prüfsumme, 4. Dateitransfer auf mobilen AdsD-Datenträger und Bildung von MD5-Prüfsumme 2, 5. Abgleich von Referenzwert und MD5-Prüfsumme 2, 6. Import der dateiinternen Metadaten nach Faust 5.0 professional, 7. Dateitransfer auf AdsD-Laufwerk und Bildung von MD5-Prüfsumme 3, 8. Abgleich mit Referenzwert, MD5-Prüfsumme 2 und 3, 9. Bildung von Referenzketten und Darstellung digitaler Dokumente über Faust-internen Viewer.

Bereits in der Planungsphase wurde deutlich, welch hohen Stellenwert Metadaten bei der Gewährleistung der Langzeitarchivierung und -verfügbarkeit digitaler Dokumente auf physikalischer, logischer und konzeptioneller Ebene einnehmen. Sie sind unentbehrlich bei der Sicherstellung von Authentizität, Integrität und Vollständigkeit der übernommenen digitalen Dokumente.

Beispiel C

Übernahme digitaler Metadaten und Dateien des Bundesvorstandes der Gewerkschaft der Polizei (GdP) aus Dokumentenmanagementsystem (DMS) ELO office 6.0 und Transfer in Archivdatenbanksystem Faust 5.0 professional des AdsD – kaskadierende Metadatenstruktur

Wie zu Beginn angedeutet, entsprach die dritte Übernahme weitgehend dem zweiten Beispiel. Der Unterschied bestand allerdings darin, dass die übernommenen Metadaten in einer komplexeren Struktur vorlagen, was den technischen und Planungsau

fwand erhöhte. Sämtliche Arbeitsschritte zur Gewährleistung der Datenintegrität entsprechen dem vorherigen Beispiel und werden an dieser Stelle nicht noch einmal angeführt.

Die Metadaten stammten nun nicht nur aus der Ebene, in der das digitale Dokument lag, (dokumentenspezifisch), sondern zusätzlich aus den Gliederungsebenen „Aktenschrank“, „Aktenordner“ und „Register“. Die Metadaten einer jeden Gliederungsebene konstituierten jeweils einen Datensatz. So können insgesamt bis zu fünf Datensätze – Datensätze aus o.g. Gliederungsebenen, dokumentenspezifischer Datensatz und Datensatz aus dateiinternen Metadaten – ein digitales Dokument sowie dessen Entstehungsumgebung und -zusammenhang beschreiben. Die jeweiligen Datensätze wurden sukzessive eingelesen und über Referenzfelder miteinander verknüpft. Das jeweilige Dokument wurde in einem folgenden Arbeitsschritt an diese Datensatzkette – die horizontale Referenzkette – gehängt.

Gliederungsebenen

Nach dem gleichen Prinzip, wie die einzelnen Datensätze resp. Metadaten horizontal miteinander verknüpft wurden, dienten entsprechende Referenzfelder dazu, die jeweiligen Datensätze auch vertikal miteinander zu verbinden. Dem Datenmodell des DMS ELO office 6.0 zufolge, bilden sich Vorgänge nur durch spezielle Einträge in den Metadaten ab. Diese Einträge wiederum sind in sämtlichen Metadaten zu denjenigen digitalen Dokumenten zu finden, die am Vorgang beteiligt waren. Somit ist der Vorgang – das Grundelement eines Dokumentenmanagementsystems – sowohl als Objekt als auch als Prozess erkennbar. Um erkennen zu können, wo der Vorgang beginnt und endet, sind den erwähnten Einträgen die Zeichen + und nachgestellt: + bedeutet, dass die Verknüpfung vom betreffenden digitalen Dokument ausgeht; das – in den Metadaten des Zieldokuments symbolisiert den Endpunkt der Verknüpfung. Wie im Falle der horizontalen Referenzketten konnten über die jeweiligen Einträge in den Metadaten vertikale Datensatzketten – die vertikale Referenzkette – gebildet werden.

Abbildung von Vorgängen Horizontale und vertikale Referenzen

Wie bereits erwähnt, bietet die Version Faust 5.0 professional nicht die Möglichkeit, einen generierten Stammdatensatz sukzessive um weitere Metadaten anzureichern. Liegen die Metadaten des DMS zudem in der vorgestellten Struktur vor, ist der gewählte Weg über Datensatzketten und Referenzverknüpfungen notwendig, um die Ordnung abzubilden, wie sie zuvor im DMS geherrscht hatte. Die demnächst im AdsD verfügbare Version Faust 6.0 bietet dagegen die Funktion, dass ein generierter Datensatz um beliebig viele Metadaten ergänzt werden kann – Import mit Updating. Auf diese Weise können erhebliche Redundanzen vermieden werden, die bislang noch in Kauf genommen werden müssen. Das Prinzip der Rekonstruktion und Abbildung von Vorgängen bleibt aber nach wie vor das gleiche. Angemerkt sei an dieser Stelle nur, dass das DMS ELO office 6.0 in dieser Hinsicht keinen Sonderweg beschreitet.

Bei der Auseinandersetzung mit diesem Thema wurde wieder deutlich, wie wichtig es ist, dass Archive bereits in der Planungsphase von Dokumentenmanagementsystemen mit am Tisch sitzen, um zukünftige Archivierungsanforderungen zu formulieren. Die Auf- und Bearbeitung sowie der Import der übernommenen Metadaten war weniger eine technische als vielmehr eine planerische und organisatorische Herausforderung.


1 BISMAS ist die Abkürzung für Bibliographisches Informations-System zur Maschinellen Ausgabe und Suche und wurde vom Bibliotheks- und Informationssystem der Carl-von-Ossietzky-Universität Oldenburg entwickelt.

2 Die Simulation der Übernahme und Aufbereitung einer n-dimensionalen Datenbank konnte bereits erfolgreich im AdsD durchgeführt werden. Sie wurde in ihre einzelnen Relationen aufgeteilt und diese wiederum im CSV-Dateiformat gespeichert. Die Attribute, die die referentielle Integrität der Datenbank gewährleisten, wurden in einer speziellen Strukturdatei abgelegt. Von dort werden sie mit entsprechender Software ausgelesen und dienen dazu, die ursprüngliche Datenbank zu rekonstruieren. Das Ziel dieser Vorgehensweise ist, nicht mehr auf das proprietäre Datenbankmanagementsystem angewiesen zu sein, und die Datenbasis – und deren Struktur – der übernommenen Datenbank auch in Zukunft erhalten zu können und lesbar zu halten.

3 Im Laufe des Projekts wurde die Entscheidung getroffen, nicht nur die Metadaten-Exportdatei vor Ort zu generieren, sondern das komplette Datenbanksystem BISMAS aus technischen und Organisationsgründen ins AdsD zu überführen. Nach Rücksprache mit dem Hersteller hatte dieser keine Einwände gegen den Transfer.

4 Mit Hilfe des sog. Systems zur Selbstüberwachung, Analyse und Statusmeldung, engl. Self-Monitoring, Analysis and Reporting Technology (SMART bzw. S.M.A.R.T.), können verschiedene Betriebsdaten von Festplatten ausgewertet werden, die Hinweise auf den technischen Zustand und mögliche Defekte geben.]

5 Darüber hinaus wird momentan geprüft, inwieweit sich Prüfsummen auch als sog. Persistent Identifier einsetzen lassen, da Prüfsummen u.a. unabhängig vom jeweiligen Ort der Speicherung sind.

6 Derzeit laufen im AdsD auch Versuche mit der Software JHOVE zur Gewinnung technischer Metadaten aus digitalen Dateien. JHOVE: Journal Storage / Harvard Object Validation Environment. Ende Mai 2005 wurde JHOVE als Open Source Software für die Öffentlichkeit freigegeben. Dieser Release enthält spezifische Module für folgende Formate: PDF, TIFF, JPEG, JPEG2000, GIF, AIFF, WAVE, XML, HTML, UTF-8, ASCII und BYTESTREAM. JHOVE stellt eine Software-Umgebung für entsprechende Java-Module dar, die wiederum ausgewählte Dateien nach spezifischen Metadaten parsen. JHOVE wird u.a. im kopal-Projekt eingesetzt.

7 Horizontal in diesem Zusammenhang bedeutet, dass die zusammengehörigen Datensätze über entsprechende Felder miteinander verbunden werden, ähnlich wie Perlen auf einer Schnur. Dabei wird die Herkunft der Metadaten aus der DMS-Gliederung, die die Datensätze konstituieren, nicht berücksichtigt.