ScaDS Logo

CENTER FOR
SCALABLE DATA ANALYTICS
AND ARTIFICIAL INTELLIGENCE

Privatsphäre-erhaltende Veröffentlichung gewerblicher Mobilitätsdaten

Global positioning systems (GPS) sind mittlerweile Standard in mobilen Endgeräten wie Smartphones oder Fahrzeugen und ihre wachsende Verfügbarkeit treibt die Entwicklung ortsbasierter Appangebote stark voran. Solche mobilen Dienste, die auf Basis räumlich-zeitlicher Daten arbeiten, haben interessante und nützliche Anwendungen für eine private Endkundschaft. Apps, die Funktionalitäten wie Navigation, Sport- und Gesundheitstracking, geosoziale Dienste wie Check-in und Geotagging oder Augmented-Reality-Spiele anbieten, sind nicht mehr aus unserem Alltag wegzudenken. Die Erhebung und Auswertung dieser Daten ist jedoch höchst kritisch, da sie persönliche Informationen enthalten oder auf diese schließen lassen. Es konnte beispielsweise gezeigt werden, dass die Bewegungsprofile von Menschen so eindeutig sind, dass sich eine Person leicht auf Basis einiger Stationen auf ihrem Weg identifizieren lässt. Lassen sich Personen zu einer Route zuordnen, können die sogenannten Places of interest (POI) sensible Informationen preisgeben. Diese können z.B. die Privat- oder Arbeitsadresse verraten und Schlüsse über die politische und religiöse Orientierung oder über die finanzielle Situation einer Person zulassen.

Auch im gewerblichen Kontext bietet die Verwertung räumlich-zeitlicher Daten großes Potential aber ebenso ein hohes Privatsphärerisiko. Im Rahmen des Projektes DE4L werden von Logistikpartner*innen mithilfe von Sensorboxen auf Transportfahrzeugen während der Fahrt verschiedene geographische Messwerte gesammelt und zusammen mit der GPS-Komponente für Auswertungen zur Verfügung gestellt. Interessante Anwendungsbereiche liegen bei diesen Daten z.B. in der Stadtplanung, Verkehrsmodellierung oder der Visualisierung der Messwerte in Übersichtskarten. Im Gegensatz zu Privatpersonen liegt das größte Privatsphärerisiko hier in der Offenlegung von Geschäftsbeziehungen, die für Mitbewerbende des Marktes interessant sind und durch die Veröffentlichung exakter Addressdaten gefährdet werden könnten.

Das Ziel des sogenannten Privatsphäre-erhaltenden Lernens ist es daher, Nutzen aus den Daten zu ziehen, ohne dass die Privatsphäre der Dateninhabenden beeinträchtigt wird. Zum Schutz der Privatsphäre von Addressdaten wurden verschiedene Techniken entwickelt, die sich im Forschungsfeld der Location Privacy Preserving Mechanisms (LPPM) ansiedeln. Privacy-Verfahren arbeiten mit verschiedenen Techniken, wie z.B. Differential Privacy, k-anonymity, Federated Learning oder kryptographischen Ansätzen.

Im Rahmen der Bachelorarbeit soll die Privatsphäre-erhaltende Veröffentlichung gewerblich gesammelter Mobilitätsdaten untersucht werden. Für die Bearbeitung des Themas steht ein Datensatz zur Verfügung, der im Rahmen des Projektes DE4L aktuell entsteht. Daher soll der Fokus hier insbesondere auf dem Schutz von Geschäftsaddressen liegen. Nachdem ein Überblick über geeignete LPPM-Verfahren gegeben wurde, sollen einige davon implementiert und auf dem Datensatz getestet werden. Dabei soll ein geeigneter Privacy-Accuracy-Tradeoff gefunden werden und die Privatsphäre mit einer geeigneten Privacy-Metrik bewertet werden. Die Accuracy kann dabei datenzentriert, also unabhängig von einem konkreten Use Case, oder anwendungszentriert und damit bezogen auf einen selbst gewählten Anwendungsfall, untersucht werden.

 

Bearbeitungszeitraum: ab sofort möglich

Kontakt: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!