ZBW MediaTalk

von Yvonne Tunnat

Die Studie “Open is not forever: a study of vanished open access journals” (PDF) von Mikael Laakso, Lisa Matthias und Najko Jahn klingt auf den ersten Blick alarmierend, denn sie legt den Finger in eine Wunde der Open-Science-Community: Open-Access-Zeitschriften verschwinden manchmal einfach wieder aus dem Internet. Konkret geht es um 176 Open-Access-Zeitschriften aus unterschiedlichsten Disziplinen, die von 2000 bis 2019 aus dem Internet verschwunden sind. Ob wir uns jedoch Sorgen machen müssen, welche Zeitschriften und Länder betroffen sind und wie Institute wie die ZBW gegen das Verschwinden arbeiten, zeigt Yvonne Tunnat in ihrem Beitrag.

Die verschwundenen Open-Access-Zeitschriften: Wirklich ein Problem?

Sowohl für Autor:innen als auch für Lesende ist die Nachhaltigkeit der Quellen im Internet unabdinglich, schließlich möchten wir uns darauf verlassen können, dass etwas, das wir heute im Internet lesen und möglicherweise auch für eigene Arbeiten referenzieren oder selbst schreiben, morgen auch noch da sein wird. Auch die Autor:innen möchten selbstverständlich ihre Paper in Zeitschriften publizieren, die diese auch langfristig vorhalten.

Bevor wir uns aber nun mit den verschwundenen Zeitschriften im Detail befassen, ist es sinnvoll, sich zunächst die Definition von „verschwunden“ anzusehen. Um als „verschwunden“ im Sinne der Studie von Laakso, Matthias und Jahn zu gelten, müssen die Open-Access-Zeitschriften (OA-Zeitschriften) zwei Bedingungen erfüllen: (1) Von der OA-Zeitschrift muss mindestens eine Ausgabe publiziert worden sein und (2) die Zeitschrift ist inzwischen aus dem Internet verschwunden (und auch über andere Wege, zum Beispiel über Bibliotheken, sind nur weniger als 50% der Artikel noch verfügbar).

Laut des Science-Beitrags “Dozens of scientific journals have vanished from the internet, and no one preserved them” von Jeffrey Brainard handelt es sich bei den Beispielen aus der Studie grundsätzlich nicht um Zeitschriften, die von namhaften Verlagen oder Repositorien herausgebracht wurden. Keine der Institutionen, deren OA-Zeitschriften wieder aus dem Internet verschwunden sind, habe in der Forschung eine große Rolle gespielt. Einige der “verschwundenen” OA-Zeitschriften waren sogar lediglich sogenannte Predatory Journals. Jene würden von dem Directory of Open Access Journals (DOAJ) nicht re-indexiert werden und daher als verschwunden gelten.

“Open is not forever: a study of vanished open access journals” (PDF) von Mikael Laakso, Lisa Matthias und Najko Jahn (eigene Darstellung).

Die Tabellen zeigen, dass die meisten OA-Zeitschriften in der Zeit von 2010 bis 2014 verschwunden sind, nämlich 112 von 176. Der überwiegende Teil (110 Zeitschriften) kommt aus Nordamerika und Europa, während im Mittleren Osten und in Afrika lediglich insgesamt sieben Zeitschriften verschwanden.

“Open is not forever: a study of vanished open access journals” (PDF) von Mikael Laakso, Lisa Matthias und Najko Jahn (eigene Darstellung).

Diese Zahlen sind vor allem mit Blick auf die Gesamtzahl der existierenden Open-Access-Zeitschriften aussagekräftig. Im Directory of Open Access Journals waren im Jahr 2019 14.068 Zeitschriften verzeichnet. Bei den 176 Zeitschriften handelt es sich also um lediglich 1,25% der gesamt verfügbaren OA-Zeitschriften. Insgesamt gesehen ist das Phänomen der verschwundenen OA-Journals also klar die Ausnahme.

Digitale Langzeitarchivierung oft nicht gesichert

Die Studie von Laakso, Matthias und Jahn verweist aber noch auf ein anderes Problem: Nur 4.057, also knapp 29%, der 14.068 OA-Zeitschriften haben eine gesicherte digitale Langzeitarchivierung. Das bedeutet, dass deren Inhalte zwar aktuell auf Servern gehostet und möglicherweise auch im Hintergrund im Serverraum redundant gespeichert werden, es aber keinerlei Kontrolle darüber gibt, ob die Dateiformate noch aktuell und lesbar sind. Wichtiger noch, da die meisten Artikel eher in unproblematischen Dateiformaten wie PDF vorliegen, ist, dass es beim Verschwinden der Zeitschriften keinen zweiten Ort gibt, an dem die Inhalte vorgehalten werden. Solche zweiten Orte, sowohl für zugangsbeschränkte als auch für offene Zeitschriften, könnten beispielsweise Bibliotheken oder Lösungen der Langzeitarchivierung wie LOCKSS, CLOCKSS (= Controlled LOCKSS) und Portico sein (Portico, CLOCKSS und LOCKSS archivieren sowohl Open-Access- als auch Closed-Access-Zeitschriftentitel).

“Open is not forever: a study of vanished open access journals” (PDF) von Mikael Laakso, Lisa Matthias und Najko Jahn (eigene Darstellung).

Natürlich bedeutet das nicht zwangsläufig, dass Inhalte, die nicht an einem zweiten Ort gesichert werden, unmittelbar Gefahr laufen, gleich morgen aus dem Internet zu verschwinden. Darüber hinaus ist es auch richtig, dass die Gefahr des Verschwindens nicht nur OA-Zeitschriften, sondern auch zugangsbeschränkte Inhalte betrifft, nur liegen diese außerhalb des Fokus der Studie.

Beispiel ZBW: Langzeitarchivierung wirtschaftswissenschaftlicher Literatur

Ein wesentlicher Baustein, um das Verschwinden von relevanten Open-Access-Zeitschriften zu verhindern, ist eine flächendeckende digitale Langzeitarchivierung. Wie diese funktionieren kann, zeige ich am Beispiel meines Arbeitsbereichs in der ZBW. Ihr Sammelauftrag für wirtschaftswissenschaftliche Literatur ist explizit überregional, betrifft also viele Sprachen und Länder. Allerdings kann die ZBW nicht alles sammeln, sodass ein Fokus auf die für unsere Nutzer:innen wichtigste Literatur gelegt wird. Für die Wirtschaftswissenschaften können wir davon ausgehen, dass jene Zeitschriften, die tatsächlich innerhalb der letzten 20 Jahre wieder aus dem Internet verschwunden sind, unter unserem Radar liefen, weil entweder Sprache oder spezifisches Thema zu exotisch waren und sie daher für unsere Nutzer:innen nicht ausreichend relevant waren.

Die ZBW formuliert klar das Ziel, dass, was einmal bei uns gefunden wurde, auch zukünftig bei uns zu finden sein wird. Wir garantieren die Sicherung unter der persistenten Adresse und gewährleisten Intaktheit und Lesbarkeit des Inhalts. Wofür wir die Verantwortung übernommen haben, das sichern wir mit einem Anspruch auf Vollständigkeit für unbestimmte Zeit. Die wichtigste Open-Access-Quelle der ZBW ist EconStor. Als fachliches Repositorium für die Wirtschaftswissenschaften wird es mittlerweile von über 600 Wissenschaftseinrichtungen und über 1000 Einzelautor:innen zur Verbreitung ihrer Veröffentlichungen im Open Access genutzt. Zudem greifen über 100 Zeitschriften zur Sicherung ihrer Inhalte auf EconStor zurück. Für Literatur, die nicht autorenbasiert ist (wie zum Beispiel Statistiken oder Firmenberichte) oder die nur zugangsbeschränkt bereitgestellt werden kann, ist in der ZBW das Digitale Archiv zuständig. Sowohl EconStor als auch das Digitale Archiv werden von der ZBW langzeitarchiviert. Damit können die Inhalte nicht ohne Weiteres aus dem Internet verschwinden.

Die ZBW bietet ihren Nutzer:innen auch Zugang zu zugangsbeschränkten Zeitschriften. Da sie für diese allerdings keine Hosting-Rechte besitzt, kann sie hier keine digitale Langzeitarchivierung sicherstellen. Im Jahr 2017 haben wir geprüft, inwiefern die Langzeitarchivierung für diese Zeitschriften bereits sichergestellt ist, und kamen zu dem Ergebnis, dass die nachhaltige Verfügbarkeit bereits für den Großteil durch CLOCKSS, Global LOCKSS, Portico, die Library of Congress oder das Scholars Portal sichergestellt ist.

Wie die digitale Langzeitarchivierung konkret funktioniert

Zur digitalen Langzeitarchivierung überführen wir die Materialien, die von der ZBW gehostet werden, in unser Langzeitarchivierungssystem. Dies beruht auf der Softwarelösung Rosetta von ExLibris. Rosetta bietet Mechanismen an, die Inhalte und Dateiformate regelmäßig auf Intaktheit und technologische Aktualität prüfen. In der Regel werden die Inhalte im PDF-Format gespeichert. Für dieses Format haben wir daher bereits umfangreiche automatisierte Qualitätskontrollen etabliert. Das PDF-Format ist ein nachhaltiges Format, sofern es gewisse Qualitätsansprüche erfüllt. Erfüllt es diese nicht, wird es von uns entsprechend nachbearbeitet. Auch Inhalte in anderen Dateiformaten werden von uns engmaschig beobachtet und gegebenenfalls bearbeitet.

Ein anderes wichtiges Arbeitsfeld sind die Metadaten. Nicht nur inhaltliche Metadaten, wie Informationen zum Titel, Autor:innen, Erscheinungsjahr, werden von uns erfasst und gepflegt, auch technische Metadaten, zum Beispiel zum Format und zur Anzeige-Software, werden von uns ermittelt und wenn nötig aktualisiert. Vorzugsweise werden offengelegte und weit verbreitete Dateiformate archiviert. Die ZBW pflegt eine umfangreiche Policy für die Langzeitarchivierung und auch eine Dateiformat-Policy.

Tipps für die Langzeitarchivierung

Zum Schluss noch ein paar Empfehlungen für Neulinge in Sachen Langzeitarchivierung zum praktischen Vorgehen: Aus unserer Perspektive können wir zum Beispiel das Verwenden von Open Source-Tools, die von der Community genutzt und gepflegt werden, empfehlen. Hierbei handelt es sich beispielsweise um Software zur Dateiformaterkennung, die das genaue Format der archivierten Inhalte automatisiert bestimmen kann, was eine Grundvoraussetzung dafür ist, die Nutzbarkeit der Datei nachhaltig zu sichern.

Manchmal ist es notwendig, die Inhalte in ein neues, moderneres und sichereres Dateiformat zu überführen. Migrationssoftware dafür ist teilweise ebenfalls Open Source und wird von der Community gepflegt. Eine wichtige Adresse für die Pflege und das Bereitstellen solcher Tools ist die Open Preservation Foundation. Ebenfalls ist es wichtig, Erfahrungen in der Langzeitarchivierung mit der Community zu teilen. Die wichtigste deutschsprachige Adresse ist hier das nestor-Netzwerk. Zurzeit ist die ZBW in insgesamt drei nestor-Arbeitsgruppen aktiv. Deren Arbeitsergebnisse stehen grundsätzlich allen offen zur Verfügung. Außerdem organisiert nestor Workshops und Konferenzen, die ebenfalls kostenlos allen offenstehen. Hier wird Wissen geteilt und Best Practices gemeinsam erarbeitet.

nestor ist mit internationalen Netzwerken wie der Digitalen Preservation Coalition verbunden. Da deren Arbeitsergebnisse und gemeinsam gepflegten Tools allen offenstehen, wird auch der Einstieg in die digitale Langzeitarchivierung erleichtert. Dabei kann auf die Erfahrungen anderer zurückgegriffen und somit Fehler vermieden und Ziele schneller erreicht werden.

Die nationale und internationale Community arbeitet an vielen Stellen zusammen und unterstützt Newcomer. Auch die ZBW ist seit zehn Jahren fester Bestandteil dieser Community. Je mehr Wissen und bessere Werkzeuge öffentlich verfügbar sind, desto leichter ist es auch für kleinere Institutionen und Verlage, die digitale Langzeitarchivierung anzugehen. Dies wird hoffentlich dazu führen, dass in der nächsten Studie die Zahl der verschwundenen OA-Zeitschriften noch wesentlich kleiner und unbedeutender ausfallen wird als in der Studie von Laakso, Matthias und Jahn.

Autorin: Yvonne Tunnat

Yvonne Tunnat ist Bibliothekswissenschaftlerin und in der ZBW – Leibniz-Informationszentrum Wirtschaft für die Digitale Langzeitarchivierung zuständig. Innerhalb der Community ist sie national und international hauptsächlich mit ihrem Arbeitsfeld Dateiformaterkennung und Dateivalidierung vernetzt.

Quellenangaben der Fotos/Grafiken:
Porträt von Yvonne Tunnat: ZBW
Diagramme: “Open is not forever: a study of vanished open access journals” (PDF) von Mikael Laakso, Lisa Matthias und Najko Jahn (eigene Darstellung).

The ZBW – Leibniz Information Centre for Economics is the world’s largest research infrastructure for economic literature, online as well as offline.

Next Post