Neue
Kommunikation für
eine neue Zeit

Let your data support you! Wie Machine Learning und Natural Language Processing Medien unterstützen

Franz Julian Rollshausen (ZDF Digital)

Über den Vortrag

Die Menge an Videoinhalten auf dem VOD-Markt wächst von Tag zu Tag. Damit erleben wir auch eine enorme Zunahme der Verfügbarkeit von Metadaten, von denen ein großer Teil Textdaten sind. Die Kombination von Text Mining und maschinellem Lernen ist zu einer vielversprechenden Methode geworden, um die verborgenen Schätze in unseren Datenbanken zu heben. Im nächsten Schritt verspricht die Kombination dieser Technologie mit den Insights aus Nutzungsdaten eine Vielzahl von Anwendungen im Medienumfeld.

Wie kann ein sinnvolles Sprachmodell trainiert werden?

Wir wollen zeigen, wie maschinelle Lernverfahren es ermöglichen, Metadaten aus Untertiteln, Teasertexten und Beschreibungen von Videoinhalten zu gewinnen und wofür diese verwendet werden können. Dabei stehen Text-Mining-Technologien, die Schlüsselwörter, grammatikalische Informationen und Entitäten (z.B. Personen, Orte oder Organisationen) aus Texten extrahieren bis hin zu fortgeschritteneren NLP-Verfahren im Mittelpunkt. Darüber hinaus zeigen wir auf, wie ein sinnvolles Sprachmodell trainiert werden kann, indem neuronale Netze auf Untertitel angewendet und beispielsweise zur Klassifizierung, aber auch zur timecodebasierten Beschreibung von Inhalten, eingesetzt werden können. Die sich daraus ergebenden Informationen sind hilfreich für Redaktionen, Archive und Produzenten im Bereich audiovisueller Inhalte, um zwischen Metadatenvariablen und Erfolgsmessung eine Beziehung herzustellen, bzw. um Erfolgsvariablen für Inhalte sogar vorherzusagen.

Der Vortrag präsentiert unter anderem erste Ergebnisse des BMWI-geförderten Projekts AI4MediaData (Konsortium: ZDF Digital Medienproduktion GmbH, Fraunhofer IAIS, Hochschule Mainz, DDG). Ziel ist es, den Prototyp einer Softwareplattform zu entwickeln, die KI-basiert Daten aus unterschiedlichen Quellen zusammenführt, analysiert und verwertet. Die Software analysiert Mediendaten mithilfe von KI-Methoden und verknüpft die gewonnenen Informationen zu datenbasierten Entscheidungshilfen. Neben den eigentlichen Medieninhalten fließen auch Metadaten (z.B. Inhaltsbeschreibungen), Nutzungsdaten (z. B. Anzahl von Abrufen) ein.

Über Franz Julian Rollshausen

Franz Julian Rollshausen ist Produkt- und Projektentwickler im BereichAnalytics | R&D bei ZDF Digital und arbeitet dort an Machine Learning-Lösungen im Medienumfeld, u.a. im Rahmen des vom BMWI-geförderten Projekts AI4MediaData. Seit August 2018 ist er für ZDF Digital und seit 2019 nebenberuflich in der Lehre des Institut für Publizistik an der Johannes Gutenberg Universität im Bereich Medienmanagement tätig.
 

Medien Workshop