Systematisierung von Dokumentenbeständen mit statistischen Verfahren
Silvio Peikert ist wissenschaftlicher Mitarbeiter und Projektmanager bei Fraunhofer FOKUS.
Silvio Peikert ist wissenschaftlicher Mitarbeiter und Projektmanager bei Fraunhofer FOKUS.
Zum Aufbau eines aufgabenorientierten Recherchesystems müssen Dokumentenbestände kategorisiert werden. Wachsende Datenbestände und der Anspruch diese fortlaufend aus einer Vielzahl von Quellen zu erweitern, erzeugen hierfür hohe Aufwände. Themenmodellierung ist ein statistischer Ansatz Dokumentenbestände automatisiert zu kategorisieren. Das dabei entstehende Modell ermöglicht die Identifikation von Themen in einem Dokumentenbestand und darauf basierend automatische Klassifikation, Ähnlichkeitsanalyse und Empfehlungsfunktionen. Anhand eines kleinen Dokumentenbestandes aus dem Bereich Denkmalsschutz wird veranschaulicht, wie dieser Ansatz aus dem Bereich Big Data auch in domänenspezifischen Anwendungen das Erschließen eines Dokumentenbestandes unterstützt.
Als Computer Scientist in verschiedenen Innovationsprojekten aus den Bereichen Medientechnik, Imageprocessing, Augmented Reality, Embedded Systems und Business Intelligence erwarb Herr Peikert umfangreiche Expertise in der systematischen Entwicklung softwaregetriebener Systeme und Verfahren.
Derzeit entwickelt Silvio Peikert im Rahmen von Qurator cloudbasierte Lösungen zur Erstellung und Nutzung von Wissensbasen unter Einsatz von KI- und Semantic Web Technologien.