Neue
Kommunikation für
eine neue Zeit

QURATOR –
Curation Technologies

The platform for intelligent content solutions

Das Bündnis der Wachstumskerninitiative, die im Rahmen des Programms „Unternehmen Region“ vom Bundesministerium für Bildung und Forschung (BMBF) über drei Jahre gefördert wird, umfasst 6 Unternehmen und 4 Forschungseinrichtungen und Institutionen.

"Langfristig zielt das Vorhaben darauf ab, die Metropolregion Berlin-Brandenburg zu einem global anerkannten Exzellenzstandort für digitale Kuratierungstechnologien zu etablieren."

Georg Rehm, wissenschaftlich-technischer Koordinator im Projekt QURATOR

Im Duktus von IT-Experten steht Kuratieren für all das, was mit der Verarbeitung von Wissen zusammenhängt – also für das Suchen, Auswählen, Zuordnen, Zusammenfassen, Bewerten und Verknüpfen von Informationen.

Die Ziele

Angesichts des stark wachsenden und fragmentierten Informationsangebotes stehen viele Branchen unter Druck, immer mehr Inhalte in immer kürzerer Zeit für die digitale Publikation aufzubereiten und zu publizieren. Geschäftsmodelle werden dadurch unrentabel. Vor diesem Hintergrund soll QURATOR dazu beitragen, Kuratierungstätigkeiten und die Generierung digitaler Inhalte in verschiedenen Branchenkontexten durch Automatisierung hochwertiger, effizienter und kostengünstiger zu gestalten und Wissensarbeiter*innen und Redakteur*innen bei der Kuratierung digitaler Inhalte zu unterstützen. Eine wesentliche Grundlage der Plattform bilden intelligente Methoden und Verfahren auf Grundlage generischer Sprach- und Wissenstechnologien, Maschinellem Lernen (ML) und Künstlicher Intelligenz (KI).

Viele klassische Aufgaben der Content Curation können Nutzer*innen dann mit Hilfe der Plattform zu einem großen Teil oder unter Umständen sogar vollständig automatisch ausführen lassen. Dazu zählt zum Beispiel das Monitoring unterschiedlichster Informationsquellen – von der Google-Suche und Wikipedia-Abfragen bis zu Online-Recherchen in diversen Fachdatenbanken, aber auch das Katalogisieren und Annotieren digitaler Archive, die automatisierte Zusammenstellung von themenspezifischen Dossiers oder das Storytelling für einen Fach-Blog.

„Ich freue mich darauf, mit QURATOR eine der wichtigsten Herausforderungen unseres digitalen Zeitalters anzugehen – egal ob Unternehmen, Kultureinrichtungen oder staatliche Stellen, wer heute relevant sein will, muss digital kommunizieren.“

Armin Berger, Bündnissprecher QURATOR

Die Projekte

KI-Plattform für Kuratierungstechnologien
Im Mittelpunkt des Teilprojekts steht die Entwicklung einer flexiblen KI-Plattform für die adaptive Analyse und kreative Generierung digitaler Inhalte in branchenübergreifenden Kontexten. Es umfasst die Entwicklung diverser semantischer Anreicherungs-, Produktions- und Generierungsdienste, die über die Plattform bereitgestellt werden wie beispielsweise Named Entity Recognition (NER), die Extraktion von Relationen und Zeitausdrücken oder die Identifikation diskursiver Strukturen und Falschnachrichten (Fake News).

Wikidata
Wikidata ist eine kollaborativ erstellte freie Wissensdatenbank und ein Schwesterprojekt von Wikipedia. Ihre Daten sind ein wichtiger Grundbaustein für die QURATOR-Plattform, die im Bündnis entwickelt wird. Für das Bündnis liefert Wikidata grundlegende Daten, die von den Bündnispartnern zur Kuratierung und Anreicherung verwendet werden. Um die an Wikidata gestellten Anforderungen an Datenqualität und -quantität sowie Zugänglichkeit erfüllen zu können, werden im Projekt Werkzeuge und Prozesse für die Wikidata Editoren, Datenspender und -nachnutzer entwickelt.

Automatisierung von Machine Learning
Ziel des Teilprojekts ist die Entwicklung einer automatisierbaren Softwareinfrastruktur für Machine Learning (ML). Machine Learning bildet die technologische Grundlage vieler neuer Anwendungen im Bereich der künstlichen Intelligenz, die über die nächsten Jahre voraussichtlich alle Lebensbereiche unserer Gesellschaften prägen werden. Die QURATOR-Plattform erhält damit eine technologische Basis für Machine Learning, die eine kontinuierliche Verbesserung von Kuratierungs-Tools und –Sevices ermöglicht

Interaktives Storytelling
Zu den Vorhaben im Bereich interaktives Storytelling gehört zum einen die Entwicklung generischer Kuratierungstechnologien und Tools für interaktives Storytelling. Das umfasst  Verfahren zur maschinell-­gestützten Analyse und Veredelung umfangreicher multimedialer Medienarchive, die Entwicklung spezialisierter und standardisierbarer Autorenwerkzeuge sowie intelligente Verfahren zur Generierung von interaktiven Benutzerinterfaces für Storytelling. Des Weiteren werden Verfahren zur Generierung von Erzählsträngen nach narrativen Mustern erprobt, z.B. Audio-Narrationen für ortsbezogene Audio-Tour-Guides.

Multimediale Ausstellungs-Kuratierung
Dieses Projekt umfasst die Erforschung und Entwicklung umfassender Kuratierungs-Tools für interaktive Multimediainhalte, die den kompletten Life Cycle der Inhaltekuratierung abdecken (Informationsextraktion, Bilderkennung, Klassifikation oder Clustering). Schwerpunkte bilden Recherche-Analyse-Tools sowie Tools zur Integration externer Wissensquellen, Kuratierungs-Tools für Mixed Reality sowie die Nutzung intelligenter Verfahren in interaktiven Exponaten im Ausstellungskontext.

TV-/Medien-Publikationen
In diesem Teilprojekt werden innovative Kuratierungs-Services für Redakteur*innen und Journalist*innen im TV-/Medienbereich entwickelt, mit deren Hilfe Prozesse zur Erstellung und Publikation audiovisueller Materialien im gesamten Redaktionsprozess verbessert werden sollen. Ziel ist es, heterogene, multimediale Inhalte miteinander zu kombinieren, zu beschriften und zu formatieren sowie für verschiedene Zielgruppen (Personalisierung, Kontextualisierung) und Ausgabemedien (Desktop, Tablet, Smartphone, Fernseher) aufzubereiten.

Digitalisiertes kulturelles Erbe
Im Teilprojekt „Automatisierte Kuratierungstechnologien für das digitalisierte kulturelle Erbe“ stehen vor allem zwei Aspekte im Vordergrund: Die Steigerung der Qualität der Digitalisierung sowie die Effizienz der Kuratierung durch KI-basierte Verfahren . Ziel ist es, dass künftig mehr Dokumente schneller und besser erschlossen und damit auch leichter recherchierbar werden. Des Weiteren werden Werkzeuge entwickelt, um die Qualität der extrahierten Texte aus gescannten Dokumenten zu verbessern – eine wichtige Voraussetzung für die semantische Analyse und Anreicherung der Inhalte.

Biomedizinisches Wissen
In diesem Teilprojekt werden Werkzeuge zur Kuratierung biomedizinischen Wissens entwickelt. Erforscht werden Technologien auf Grundlage von Natural Language Processing, Semantik und KI, mit deren Hilfe das enorm wachsende Material an biomedizinischen Veröffentlichungen automatisiert hinsichtlich Relevanz, Neuheit, Richtigkeit und Konsistenz überprüft werden kann. Perspektivisch soll dazu beigetragen werden, dass Patient*innen zukünftig mehr Kontrolle über ihre Gesundheitsversorgung haben und Ärzte sich wieder stärker auf ihre eigentliche Arbeit konzentrieren können.

Corporate Smart Insights (CSI)
Ziel des Teilprojekts ist die Erforschung und Entwicklung von Basisinfrastrukturen und Basisdiensten zur Erstellung, Extraktion, Analyse und Verwaltung von semantischem Wissen zur Nutzung in Kuratierungsworkflows von Unternehmen. Die so gewonnenen Erkenntnisse, so genannte „Corporate Smart Insights“ (CSI), werden dabei selbst als Wissensartefakte semantisch kuratiert und können als
wertvolles Unternehmenswissen für Entscheidungen und Aktionen vielfach wiederverwendet werden. Die Vision ist eine „Insight Driven Organisation“ (IDO), die nicht nur datengetrieben (Stichwort: Big Data Analytics / Smart Data) ist, sondern auch dynamisch Wissen lernt, erweitert, teilt und vielfach nutzbar macht.

Media Intelligence und Risikobeobachtung
Ziel des Teilprojekts ist die Entwicklung von Kuratierungstechnologien und -komponenten für das Monitoring von Online-Inhalten, insbesondere zum Zweck der Risikobeobachtung. In der Verwertungsphase ist deren Weiterentwicklung zu einem Softwareprodukt “Risk Monitor” zur Risikobeobachtung geplant. Dabei soll vor allem der derzeit hohe manuelle Aufwand bei der Themenformulierung und Ergebnisauswertung durch KI-Verfahren deutlich reduziert und weitere für die Risikoauswertung relevanten Quellen angebunden werden.

Intelligente Prozessmodellierung
In diesem Teilprojekt werden Kuratierungsaspekte im Kontext der Prozessmodellierung behandelt. Dabei steht das Prozessmodell als Wissenselement im Vordergrund, das mit anderen Wissenselementen verknüpft wird. Ziel ist es, informationelle Ressourcen innerhalb von Organisationen und Unternehmen besser nutzen zu können. Die Modelle sollen so modifiziert werden, dass sie auch über andere Devices als Desktop oder Tablet konsumiert werden können, um die jeweilige Rezeptionssituation besser berücksichtigen zu können. Im Projekt werden hierfür der Einsatz von Chatbots oder Augmented Reality-Szenarien erprobt.

Die Partner

3pc GmbH Neue Kommunikation

Ada Health GmbH

ART+COM AG

Condat AG

Deutsches Forschungszentrum für Künstliche Intelligenz GmbH (DFKI)

Fraunhofer Gesellschaft - Fraunhofer Institut für offene Kommunikationsdienste

Semtation GmbH

Stiftung Preußischer Kulturbesitz/Staatsbibliothek zu Berlin

Ubermetrics Technologies GmbH

Wikimedia Deutschland e.V.