11. Juli 2016 - Machine Learning zwischen Datenschutz und Datenrisiko

Datenschutz-Folgenabschätzung: Maschinelles Lernen

Wenn Überwachungssoftware automatisch lernt und die eigenen Regeln anpasst, hilft das, IT-Vorfälle aufzudecken. Wenn sich durch maschinelles Lernen allerdings die Nutzer besser identifizieren lassen, ist das eine Herausforderung für den Datenschutz.

Maschinelles Lernen hat Vorteile und Nachteile, v.a. für den Datenschutz Maschinelles Lernen darf nicht zu weit gehen. Sonst kommt es zum gläsernen Nutzer. (Bild: NicoElNino / iStock / Thinkstock)

Datensicherheit braucht (Spiel-)Regeln

Klassische Lösungen für die Datensicherheit haben ein Problem: Um Gefahren abzuwehren, müssen sie wissen, was gut und was böse ist. Sie müssen wissen, was verdächtig erscheint. Um Gefahren zu erkennen, brauchen sie deshalb Vorgaben und Regeln. Das gilt für klassische Antiviren-Software und Firewalls genauso wie für Spam-Filter oder die Applikationskontrolle.

Maschine Learning hilft bei der Anpassung der Sicherheit

Eine aktuelle technische Entwicklung kann die Situation verbessern: Dank maschinellem Lernen oder Machine Learning (ML) passen Softwaresysteme selbstständig und automatisch ihre Regeln an. Das spart Aufwand aufseiten der Administratoren und Nutzer. Außerdem verbessert sich die Datensicherheit allein schon durch den Zeitvorsprung bei der Anpassung der Regeln.

Die Definition und Pflege der Regeln verursacht bisher großen Aufwand bei den Administratoren:

  • Sie erfordern regelmäßige Updates durch den Security-Anbieter.
  • Die Regelwerke sind fehleranfällig.
  • Sie werden oft zu spät angepasst, nämlich nach dem erfolgreichen Angriff.

Tatsächlich ist die Basis für eine Überarbeitung der Security-Richtlinien meistens die Erfahrung aus IT-Sicherheitsvorfällen und Datenschutzverletzungen.

Marktforscher wie Gartner sehen daher großes Potenzial in Machine Learning, wenn es etwa um die Optimierung der Datensicherheit geht:

  • Die Sicherheitssoftware lernt selbstständig, ob ein bestimmtes Datei-Verhalten als normal oder als gefährlich einzustufen ist.
  • Die Reaktion auf das erkannte Risiko lässt sich nicht nur automatisch einleiten, sondern auch fortlaufend anpassen.

Top-Trend 2016

Doch nicht nur Security-Anwendungen machen Machine Learning für Gartner zu einem der Top 10 Strategic Technology Trends 2016.

Es gibt eine Vielzahl an Anwendungsfällen für maschinelles Lernen, etwa die automatische Optimierung von Lieferketten und die schnellere Erkennung möglicher Betrugsversuche. Spätestens beim Anwendungsfall „Optimierung der Verkehrssteuerung“ und „autonomes Fahren“ sind die möglichen Risiken des maschinellen Lernens klar, kam es doch kürzlich in den USA zu einem Todesfall in Verbindung mit einem selbstfahrenden Auto.

Maschinelles Lernen birgt Risiken

Wie alle technologischen Entwicklungen, hat auch das maschinelle Lernen zwei Seiten. Deshalb ist es wichtig, eine Datenschutz-Folgenabschätzung vorzunehmen, wie sie die kommende Datenschutz-Grundverordnung (DSGVO) vorsieht:

  • Aus Datenschutz-Sicht kann Machine Learning die Erkennung und Abwehr von Sicherheitsrisiken verbessern.
  • Es kann aber auch dazu beitragen, die Nutzer stärker zu durchleuchten. Auf der Suche nach möglichen Betrügern im Online-Shopping treiben Lösungen auf Basis von Machine Learning die Nutzeranalysen womöglich weiter, als es dem Betreiber des Online-Shops klar ist.

Nicht nur die automatisierte Betrugserkennung wird die Nutzeranalysen in neue Dimensionen bringen. Auch im Marketing und Vertrieb werden die Analysen der möglichen Käufer voranschreiten. Aktuelle Klicks, frühere Einkäufe und persönliche Informationen aus der Registrierung oder aus sozialen Netzwerken schärfen das Bild auf den Käufer.

Online-Profiling erfolgt dann nach neuen, sich ändernden Regeln, die nicht zuvor definiert sind, sondern die sich durch das maschinelle Lernen bilden.

Datenschutzkontrolle muss für Grenzen sorgen

Datenschutzbeauftragte sind gefordert, auf die Risiken des Machine Learning aufmerksam zu machen. Das Ziel darf nicht sein, dass sich in Zukunft Systeme mittels Machine Learning immer stärker ihre eigenen Spielregeln geben und Nutzeranalysen weiter treiben, als das mit dem Datenschutz vereinbar ist. Es ist keine Zukunftsmusik, dass sich die Systeme weiter in das Profiling der Nutzer begeben, als das ursprünglich gedacht war.

Entscheidend sind deshalb die Aufklärung und die klare Forderung, Lösungen nach Gesichtspunkten wie Privacy by Design auszuwählen und nicht nur auf Selbstoptimierung der Lösungen zu setzen. Ohne Datenschutzvorgaben fehlen die Grenzen für die automatischen Regeländerungen.


Download: Information der Geschäftsleitung: Machine Learning


Oliver Schonschek
Oliver Schonschek ist Diplom-Physiker (Universität Bonn), Analyst und IT-Fachjournalist im Bereich IT-Sicherheit und Datenschutz. Er ist Herausgeber und Fachautor zahlreicher Fachpublikationen.


Sie wollen mehr darüber erfahren? Nutzen Sie hierfür die Vorträge, Workshops und Intensivseminare im Rahmen des Datenschutzkongresses IDACON.Profitieren Sie zusätzlich vom Erfahrungsaustausch mit Teilnehmern und Referenten während der Veranstaltung.

Melden Sie sich hier noch schnell an! Weitere Informationen finden Sie unter www.idacon.de


Sie glauben, Sie hätten noch so viel Zeit? Falsch! Es gibt mehr zu tun, als Sie vielleicht denken! ▶ Zeit zu handeln