Zentrale Volltextsuche in Tätigkeitsberichten der Datenschutzaufsichten

Im Master-Studiengang Informatik haben Studierende jedes Sommersemester die Möglichkeit, ein sogenanntes „Text-Mining-Projekt“ zu belegen. Unter Betreuung von Dr. Jelena Mitrović bearbeiten Studierende ein Semester lang ein Thema.
Im Gegensatz zu normalen Lehrveranstaltungen bietet dieses Projekt die Möglichkeit, ein Thema auf praktische Art und Weise zu erschließen.
Da sich im selben Semester eine Zusammenarbeit zwischen dem Lehrstuhl für Data Science unter Prof. Michael Granitzer und dem Lehrstuhl für Öffentliches Recht, Medien- und Informationsrecht unter Prof. von Lewinski ergeben hat, taten sich völlig neue Themenfelder auf.
Prof. von Lewinski regte eine Zusammenarbeit mit der Stiftung Datenschutz an, die Trägerin des ZAfTDa ist. Nach einigen Gesprächen stellte sich der Wunsch nach einer Volltextsuche über den Datenbestand des ZAfTDa heraus.
Das ZAfTDa-Projekt
Stefanie Urchs, Andre Multerer und Isabella Graßl nahmen sich des Projekts an und wandelten die PDF-Berichte in Text um.
Bei den Berichten konzentrierte sich das Team auf Deutschland. Der extrahierte Text wurde in eine Suchmaschine eingepflegt und eine Benutzeroberfläche für diese erstellt.
- Benutzer können entweder nach Stichworten suchen oder unter „Erweiterte Optionen“ die Suche nach bestimmten Kriterien filtern.
- Die Suche liefert die zehn passendsten Berichte zum eingegebenen Begriff, mit jeweils bis zu drei Fundstellen.
- Filterkriterien, die die Suche zu sehr einschränken, ignoriert das System.
- Ist der Suchbegriff nicht in den Berichten vorhanden, bleibt die Ergebnisseite leer.
…