25.03.2019

Neue Datenbank: "Pressemitteilungen von Parteien und Gewerkschaften"

Die Bibliothek der Friedrich-Ebert-Stiftung sammelt seit vielen Jahren weltweit elektronische Pressemitteilungen von Parteien und Gewerkschaften und stellt sie nun der wissenschaftlichen Forschung und der interessierten Öffentlichkeit zur Verfügung. Der Aufbau der Datenbank wurde von der Deutschen Forschungsgemeinschaft (DFG) finanziell unterstützt.

Bild: "Logo-Wolke" mit einigen Parteien- und Gewerkschaftslogos


„Graue Literatur“ von Parteien und Gewerkschaften bildet seit jeher einen Sammelschwerpunkt der Bibliothek der FES. Dazu gehören Jahrbücher, Kongressprotokolle, Statuten, programmatische Schriften und Veröffentlichungen zu Einzelthemen – früher in gedruckter, heute auch in digitaler Form.

Die Gattung Pressemitteilung gehörte in der Vergangenheit eher nicht zum Sammelspektrum. Sie rückte verstärkt in den Fokus, nachdem die Bibliothek die gedruckten Pressedienste der SPD digitalisiert hatte.

Quellengattung Pressemitteilung

Pressedienste und offizielle "News", heute überwiegend e-only, sind nicht selten kurzlebig und vom Verlust bedroht. Sie sind ohne Frage sammlungswürdig, da sie die aktuellsten und am wenigsten gefilterten Informationen aus dem Politikbetrieb übertragen. Die häufig mehrmals täglich herausgegebenen Verlautbarungen eignen sich besonders gut für die neueren Untersuchungsmethoden, mit denen große Textmengen analysiert werden können (Stichwort: Text Mining).

Die Gattung erfordert eine kontinuierliche, möglichst vollständige Sammlung. Dies kann durch Webspiegelungen (d.h. Speicherungen kompletter Homepages punktuell in einem bestimmten zeitlichen Rhythmus oder anlassbezogen), wie sie inzwischen immer mehr Informationseinrichtungen betreiben, nicht annähernd erreicht werden.

Sammlung digitaler Pressemitteilungen seit 1999

Die FES-Bibliothek hat bereits zum Ende des letzten Jahrhunderts begonnen, gezielt elektronische Pressemitteilungen von Parteien und Gewerkschaften in größerem Rahmen kontinuierlich zu sammeln. Das damals für ca. 100 Pressedienste angewendete Verfahren - Analyse der Html-Seiten mit Hilfe von Perl-Skripten - stieß jedoch im Laufe der Zeit an seine Grenzen aufgrund der schnellen Entwicklungen bei den Webtechnologien.

Deshalb hat die Bibliothek nach knapp zehn Jahren die oft parallel angebotenen, einfacher strukturierten RSS-Feeds der Pressedienste ins Visier genommen und geeignete Werkzeuge für deren Erfassung gefunden. Mit der neuen Methode wurden die Pressemeldungen weitere zehn Jahre lang regelmäßig erfasst und auf ca. 200 Organisationen ausgeweitet. Das Verfahren erforderte allerdings weiterhin manuelle Eingriffe und bot keine Möglichkeit der Erfolgskontrolle. Auch blieb die zentrale Frage nach der Zugänglichkeit des Materials ungelöst.

Mit DFG-Förderung zur Datenbank

Die entscheidende Weiterentwicklung erfuhr das Projekt in den letzten zweieinhalb Jahren - dank der finanziellen Unterstützung durch die Deutsche Forschungsgemeinschaft. Für die Sammlung und Erschließung der Presse- und Newsdienste wurde eigens ein RSS- und Web-Crawler programmiert. Täglich und völlig autonom ermittelt er neue Mitteilungen, bearbeitet und speichert sie und gibt im Bedarfsfall Fehlermeldungen heraus.

Die Anzahl der erfassten RSS-Feeds wurde erheblich erhöht. Das bereits vorliegende umfangreiche Datenmaterial wurde indexiert und aufbereitet. Zusammen mit den täglich neu hinzukommenden Inhalten ist es nun in einer Datenbank zugänglich, die speziell nach den Erfordernissen der enthaltenen Quellenart gestaltet wurde. Sie bietet eine Volltextsuche mit vielfältigen Such- und Filterungsmöglichkeiten.

Die Datenbank enthält Pressemitteilungen und offizielle Verlautbarungen von weit über 500 Parteien und Gewerkschaften weltweit, die zurzeit laufend gesammelt werden. Hinzu kommt ein abgeschlossener Datenbestand von etwa 100 weiteren Organisationen. Die Laufzeiten sind sehr heterogen und gehen teilweise bis zum Jahr 2008 zurück. Der kleine ältere Bestand ab 1999 wird demnächst ebenfalls in die Datenbank eingegliedert werden. Auch wird die Pflege der laufenden RSS-Feeds in der Zukunft selbstverständlich gewährleistet sein.

 

Datenbank "Pressemitteilungen von Parteien und Gewerkschaften"

Weitere Informationen über das Projekt

 


nach oben