DATA MINING CUP 2019

Masterstudierende der Informatik der Hochschule Karlsruhe belegen hervorragenden 6. Platz bei internationalem Studierendenwettbewerb

7. Juli 2019

Rund 150 studentische Teams aus 28 Ländern haben an dem internationalen Wettbewerb „DATA MINING CUP 2019“ teilgenommen, darunter auch die drei Studierenden des Masterstudiengangs Informatik der Hochschule Karlsruhe – Technik und Wirtschaft Alexander Melde, Lukas Theurer und Christian Wernet. Mit ihrem Wettbewerbsbeitrag erreichten sie einen hervorragenden 6. Platz, gehören damit zu den drittbesten unter allen deutschen Teilnehmern und hatten sich so auch gegen Teams namhafter deutscher Universitäten durchgesetzt.

Am 3. Juli 2019 waren sie als eines unter den zehn besten studentischen Teams zum „Retail Intelligence Summit“ nach Berlin eingeladen worden, wo sie ihre Arbeiten vorstellen konnten und anschließend im festlichen Rahmen die Preisverleihung durch die prudsys AG erfolgte.

Unter Data-Mining wird die systematische Anwendung statistischer Methoden auf große Datenbestände (Massendaten oder auch „Big Data“ genannt) verstanden mit dem Ziel, neue Querbezüge oder Trends zu erkennen.

 Die 20. und damit die Jubiläumsausgabe des internationalen Studierendenwettbewerbs hatte die Aufgabe gestellt, Betrugsfälle beim mobilen Selbstscannen im Lebensmitteleinzelhandel aufzudecken. In Supermärkten kommen vermehrt sogenannte Selbstscanvorrichtungen zum Einsatz, bei denen Kunden beispielsweise mit dem eigenen Smartphone und einer supermarkteigenen App die Produkte einscannen und direkt in den Einkaufswagen legen und damit auch bezahlen. So wird der Weg über eine lange Kassenschlange umgangen. Untersuchungen zeigen jedoch, dass es bei 5 % der Vorgänge zu Ungereimtheiten kommt. Deren Ursache, ob aufgrund von bewusstem Betrug oder von Fehlern in der Smartphone-App, ist allerdings nicht bekannt.

Die Aufgabe für die Studierenden bestand nun darin, einen Algorithmus zu entwickeln, der auf Basis von anonymisierten Einkaufsdaten frühzeitig erkennt, ob ein sogenannter „Fraud“ vorliegt oder nicht. Unter Fraud werden jegliche Formen von Ungereimtheiten zusammengefasst – sei es bewusster Betrug oder eben nur ein Systemfehler.

Das Team der Hochschule Karlsruhe entwickelte mithilfe von maschinellen Lernverfahren eine Lösung, um Daten, wie etwa die Einkaufsdauer, die Anzahl der gescannten Produkte oder dessen Warenwert, weiterzuverarbeiten. So war es ihnen möglich, aufgrund von unscheinbaren Eigenschaften eines Einkaufs, auf eine Ungereimtheit zu schließen. Hierbei kam zur weiteren Datenverarbeitung auch ein neuronales Netz zum Einsatz, das anschließend „urteilt“, ob beim Einkauf ein Fraud vorliegt oder nicht. Ihnen war es dabei nicht nur wichtig, ein besonders effektives System zu entwickeln, sondern insbesondere auch, dass unschuldige Käufer keinesfalls als Betrüger abgestempelt werden. Man spricht hierbei auch von einem besonders „robusten System“ – eine wichtige Eigenschaft, da aktuell ethische Fragen beim Einsatz Künstlicher Intelligenz (KI) in der öffentlichen Diskussion stehen.

Auf den DATA MINING CUP waren die drei Studierenden über die Vorlesung „Maschinelles Lernen“ von Prof. Dr.-Ing. Astrid Laubenheimer an der Fakultät Informatik und Wirtschaftsinformatik aufmerksam geworden. Die Fakultät sowie das hochschuleigene Forschungsinstitut Intelligent Systems Research Group (ISRG) haben das Team u. a. durch IT-Infrastruktur, aber auch durch die fachliche Diskussion unterstützt.

Nähere Informationen zum DATA MINING CUP unter www.data-mining-cup.com