Hackathon Coding.Waterkant: Wie man Bibliotheksservices durch Chatsbots und künstliche Intelligenz besser machen kann

von Anastasia Kazakova und Olaf Siegert

Seit 2016 organisieren das von der Landesregierung in Schleswig-Holstein geförderte Netzwerk Netzwerk Digitale Wirtschaft Schleswig-Holstein (DiWiSH) und die gemeinnützige Initiative opencampus.sh in Kiel jedes Jahr das Waterkant.Festival. Die diesjährige Veranstaltung musste corona-bedingt virtuell stattfinden. Dazu gab es dieses Jahr als Auftakt erstmalig den Coding.Waterkant Hackathon, der in Kooperation mit Kiel.AI stattgefunden hat. Der thematische Schwerpunkt lag auf Fragestellungen aus der Wissenschaft und auf dem Einsatz von künstlicher Intelligenz (KI) zur Lösung von Problemen.

Die ZBW – Leibniz-Informationszentrum Wirtschaft war 2020 aktiv am Hackathon beteiligt und betreute zwei von uns formulierte Challenges. Dabei ging es um Innovationen rund um unsere beiden Hauptprodukte: EconStor, ein Open-Access-Repositorium und EconBiz, das Recherche-Fachportal für Wirtschaftswissenschaften.

Im Folgenden berichten die beiden ZBW-Teams kurz von ihren Erfahrungen beim Coding.Waterkant Hackathon:

Die EconStor-Challenge: nachträgliche Anreicherung von Metadaten für Volltexte

In der EconStor-Challenge ging es um das Problem, dass einige aus Nutzersicht potenziell interessante Informationen – wie zum Beispiel die einem Forschungspapier zugrundeliegenden Forschungsdaten oder der finanzierende Forschungsförderer – zwar im vorliegenden Text jeweils erwähnt, allerdings nicht in den von Bibliotheken üblicherweise erfassten, bibliografischen Daten (Metadaten) angezeigt werden. In EconStor lässt sich daher bislang nicht gezielt danach suchen oder eine bestimmte Auswahl an Metadaten entsprechend filtern (zum Beispiel per Facetten-Suche bzw. Drill-Down-Menü). Denn dazu müssten diese Informationen ja vorab aufbereitet worden sein.

Da eine nachträgliche Metadatenaufbereitung von den inzwischen rund 200.000 EconStor-Volltexten mit sehr viel (manuellem) Aufwand verbunden sein dürfte, sollte diese Aufbereitung weitestgehend automatisiert mithilfe softwaretechnischer Verfahren erfolgen, in diesem Fall also mit neuen Verfahren aus der künstlichen Intelligenz bzw. des maschinellen Lernens. Der verwendete KI-Algorithmus wird dabei auf die Erkennung bestimmter Muster trainiert, die im Kontext mit den gesuchten Informationen in wissenschaftlichen Texten immer wieder auftauchen, um so die Genauigkeit beim Auffinden dieser Daten immer weiter zu verfeinern.

Anhand eines Pilotsamples von etwa 7.000 EconStor-Dokumenten erarbeiteten zwei Hackathon-Teilnehmende eine Datenbank, in der gezielt nach diesen Informationen gesucht werden kann. Das EconStor-Team war sehr angetan von den Ergebnissen des in dieser kurzen Zeit entwickelten Prototypen und versucht nun, gemeinsam mit den Entwicklern die Ergebnisse weiter zu verbessern. Sofern eine aus Sicht der EconStor-Verantwortlichen hinreichende Trefferquote erreicht wird, wird eine Übernahme dieser Technologie in EconStor angestrebt.

Die EconBiz-Challenge: Entwicklung eines Chatbots

Das EconBiz-Team stellte ca. 4000 anonymisierte Chat-Transkripte zur Verfügung und forderte die Teams heraus, einen Chatbot für Bibliotheken zu entwickeln. Dieser sollte unseren Kolleginnen und Kollegen von EconDesk unter die Arme greifen. EconDesk ist die Online-Auskunft für die Wirtschaftswissenschaften der ZBW. Dem EconBiz-Team ging es dabei nicht darum, einen komplett fertigen Chatbot zu bekommen, den es direkt ins Produktivsystem einpflegen könnte. Das Ziel war vielmehr, zusammen mit anderen etwas Neues auszuprobieren und die Grenzen der Technologie zu testen und zu erweitern.

Das Hackathon-Team für den EconBiz-Chatbot bestand aus drei Teilnehmenden und zwei Patinnen. Zunächst ging es darum, den Rahmen des Prototyps zu umreißen, Daten vorzubereiten und eine Entwicklungsumgebung mit Rasa X aufzusetzen. Rasa X ist ein Tool, das die Entwicklung eines KI-Assistenten ermöglicht. Ziemlich schnell wurde klar, dass die Transkripte intensiver aufbereitet werden müssen, damit der Chatbot vernünftig lernen kann. Die zweite Erkenntnis: Ohne die Kolleginnen und Kollegen aus der Bibliothek kommen wir nicht wirklich voran.

Denn es reichte nicht, die Transkripte dem Rasa-X-Skript zur Verfügung zu stellen. Wir mussten die Fragen aus den Transkripten clustern und gute Antworten finden. Dank der Unterstützung der Bibliotheks-Kolleginnen und -Kollegen hatten wir am Ende des ersten Tages ein Set an Intents, das an Tag 2 noch weiter verfeinert wurde. Intents sind hierbei die Nutzerabsichten, auf die der Chatbot dann reagiert. Im nächsten Schritt ging es an das Trainieren des Chatbots, bis wir ihn schließlich am Nachmittag des zweiten Tages vorführen konnten.

Wie vorauszusehen, war unser EconBiz-Chatbot nicht perfekt. Aber er wusste, was die richtige Antwort auf „Moin!“ war und kannte die Öffnungszeiten der Bibliothek. Das EconBiz-Team hat bei dieser Challenge also jede Menge gelernt, und wir hatten sehr viel Spaß. Es war faszinierend zu sehen, wie sich bis dahin fremde Menschen auf ein Ziel hinarbeiten, sich gegenseitig unterstützen und ihr Wissen teilen. Man war irgendwie an die eigenen Studienzeiten erinnert.

Fazit zum Hackathon Coding.Waterkant

Die Teams von EconStor und EconBiz nehmen aus ihren beiden Challenges beim Conding.Waterkant Hackathon auf jeden Fall Folgendes mit: Daten sind wichtig, und ein interdisziplinäres Team ist unverzichtbar. Beide Teams werden die Umsetzung der Ergebnisse des Hackathons weiter verfolgen und sich mit den Themen Innovationen und künstliche Intelligenz auch zukünftig beschäftigen. Klar geworden ist aber auch: Neben den Möglichkeiten der künstlichen Intelligenz gibt es auch Grenzen und Gefahren. Vielleicht hostet die ZBW dazu ja mal selbst einen Hackathon? Dann aber für Bibliothekarinnen und Bibliothekare…

Die Ergebnisse des Coding.Waterkant Hackathons wurden auf Devpost, einer Plattform für Hackathons, veröffentlicht.

Das könnte Sie auch interessieren:

Über die Autor:innen:

Anastasia Kazakova ist wissenschaftliche Mitarbeiterin für forschungsbasierte Innovation und Entwicklung von EconBiz in der ZBW.

Olaf Siegert leitet die Abteilung Publikationsdienste der ZBW – Leibniz-Informationszentrum Wirtschaft und engagiert sich als ihr Open-Access-Beauftragter. Für die Leibniz-Gemeinschaft repräsentiert er den Leibniz-Arbeitskreis Open Access in externen Gremien: So ist er bei der Allianz der Wissenschaftsorganisationen in der AG Wissenschaftliches Publikationssystem und bei Science Europe für die Leibniz-Gemeinschaft aktiv.

Das Chatbot-Mockup wurde mit Botsociety und Flaticon erstellt.

Diesen Blogpost teilen:

Fehlende deutsche Übersetzung

Bibliotheken und Content-Marketing: Für wen wir eigentlich Sachen ins Netz schreiben [Leitfaden] Facebook Fragen: Mehr Wumms in der Interaktion mit Fans Vortrag: "Future Internet – Chancen und Risiken für die Medienbranche"

View Comments

Bibliotheken und Online-Veranstaltungen, Teil 3: Wie Workshops Ideenfindung und Zusammenarbeit fördern
Nächster Blogpost