Digitale Archivierung und Recht

Data For All, For Good, Forever lautet das Motto des diesjährigen Welttags der digitalen Erhaltung am 3. November 2022, übersetzt ungefähr: Daten für alle, endgültig und für immer. Im Grunde ist damit das Ziel der digitalen Langzeitarchivierung ganz knapp zusammengefasst: Daten sicher aufzubewahren, sodass sie in Zukunft für alle zur Verfügung stehen. Bei den Herausforderungen der digitalen Langzeitarchivierung denkt man dabei vielleicht zuerst an technische Fragen, denn der Unterschied zwischen analoger und digitaler Überlieferung auf der materiellen Ebene fällt als erstes ins Auge. Doch die technischen Fragen sind nicht unbedingt die komplexesten. Ein anderer Bereich, der Gedächtniseinrichtungen vor Probleme stellt, ist der Rechtsrahmen.

Denn damit Archive, Bibliotheken, Museen etc. ihr Ziel der digitalen Archivierung erfüllen können, brauchen sie die Rechtssicherheit, ihrer Aufgabe überhaupt nachkommen zu dürfen: Die Grundlage ist zunächst einmal, Daten übernehmen zu dürfen, der nächste Schritt, sie bewahren zu dürfen – und der letzte, sie auch der Öffentlichkeit zur Verfügung stellen zu dürfen. Dabei werden verschiedene Rechtsbereiche berührt, insbesondere aber das Urheberrecht und das Datenschutz- und Persönlichkeitsrecht.

Mit der Reform des Urheberrechts haben Gedächtnisinstitutionen nun zumindest die Erlaubnis zu bewahren, was sie bereits in ihren Beständen haben. Bei der Übernahme und der Bereitstellung für die Öffentlichkeit bestehen aber noch immer offene Fragen. Eine für archivalische Maßgabe sehr junge Quellengattung betrifft das besonders, nämlich Webseiten und Social Media. Die Problematik, die hier das Urheberrecht darstellt, haben wir in einem Blogbeitrag letztes Jahr bereits geschildert.

Übernahme von Social Media-Inhalten

Dabei drängt die Frage der Archivierung dieser Inhalte. So hat der SPD-Generalsekretär Kevin Kühnert im September 2022 seinen Twitter-Account deaktiviert. Damit sind diese Daten noch nicht gelöscht, aber nicht mehr öffentlich verfügbar. Falls sich Kevin Kühnert womöglich entscheiden sollte, seinen Account ganz zu löschen und seine Daten vorher nicht exportiert, wären diese Informationen mit wenigen Mausklicks ganz verloren.

Um diese drängende Frage zu klären und endlich angehen zu können, hat das Archiv der sozialen Demokratie (AdsD) im letzten Jahr von Paul Klimpel und Fabian Rack von iRights.Law eine Einschätzung vornehmen lassen, wie wir Social Media archivieren können. Dieses Gutachten ist nun als Publikation erschienen und steht allen Interessierten zur Verfügung.

Auf Grundlage dieses Gutachtens konnte das AdsD mit der Social Media-Archivierung beginnen: Seit Herbst letzten Jahres archivieren wir ausgewählte Twitter-Kanäle mithilfe eines Skripts, das das Stadtarchiv Münster zusammen mit der IT-Abteilung des Landschaftsverbands Westfalen-Lippe entwickelt hat. Bislang umfasst die Sammlung gut 20 Kanäle, geplant ist eine Erweiterung auf etwa 50 Kanäle.

Eine der Rechtsgrundlagen für die Archivierung bilden dabei die Hinterlegungsverträge, die das AdsD mit Personen und Institutionen abgeschlossen hat. Die Rechtslage bleibt aber unbefriedigend: Soziale Medien leben von der Vernetzung, dabei sind Teil der Konversation zwangsläufig auch Personen, mit denen wir keine Verträge haben. Soziale Medien hätten auch das Potential, Meinungen und Bewegungen zu dokumentieren und für die Nachwelt zu bewahren, die außerhalb der traditionellen Sammlungsbereiche von Archiven und Bibliotheken stehen. Aber auch die Möglichkeiten hierzu sind durch den Rechtsrahmen eingeengt – und was wir nicht haben, können wir nicht bewahren.

Bereitstellung von Netzinhalten

Deutlich eingeschränkt ist auch die Möglichkeit, die archivierten Inhalte der Öffentlichkeit zur Verfügung zu stellen. Das betrifft nicht nur Social Media-Inhalte, sondern z.B. auch archivierte Webseiten. Beides kann man im AdsD deshalb nur im Lesesaal einsehen. Bei diesen Quellen ist die Einschränkung auch deshalb so ärgerlich, weil bei originären Online-Quellen die Bereitstellung von APIs erweiterte Forschungs-Möglichkeiten böte und durch verbreitete Standards eine (zumindest technisch) unkomplizierte Kombination von Korpora aus verschiedenen Archiven ermöglichen würde.

Zudem handelt es sich bei archivierten Webseiten wie auch bei den Social Media-Quellen um strukturierte Daten, die oft zahlreiche eingebettete Metadaten enthalten. Diese Metadaten sind in der reinen Ansicht im Webarchiv im Lesesaal schlecht oder gar nicht zugänglich. Um zumindest die maschinelle Auswertung auf den Rechnern von Nutzer:innen zu ermöglichen, bietet das AdsD Nutzer:innen die Möglichkeit, Kopien der archivierten Social Media-Inhalte und Webseiten zu erhalten. Ein neuer Zugang im Lesesaal soll zusätzlich Abhilfe schaffen: Durch den Einsatz von SolrWayback wird es künftig möglich sein, auf den Beständen im Webarchiv auch Volltextsuchen durchzuführen, die Inhalte mit einfachen Digital Humanities-Tools zu explorieren und Inhalte im CSV-Format zu exportieren. Diese Exporte können Nutzer:innen dann wiederum in Kopie auch auf ihren eigenen Rechnern verwenden. Die Recherche in SolrWayback kann aber weiterhin nur im Lesesaal durchgeführt werden.

Sowohl im Bereich der Übernahme von Inhalten wie auch bei der Bereitstellung gilt also weiterhin: Damit wir unser Ziel Data For All, For Good, Forever erreichen, müssen die rechtlichen Rahmenbedingungen sich ändern.

Annabel Walz