Big Data und Datenschutz: Ethik ist gefragt

Das Sammeln von Kundendaten gehört im E-Commerce und beim Online-Marketing fest dazu. Was ändert sich aber, wenn daraus Big Data wird? Online-Marketing und E-Commerce setzen darauf, ihre Kunden möglichst gut kennenzulernen: Auf diese Weise lässt sich der Erfolg von Produkten messen und wer die Analyse von Kundendaten perfektioniert, kann seinen Nutzern über Empfehlungen einen echten Mehrwert bieten. Big Data verändert jedoch die Möglichkeiten, was mit diesen Nutzerdaten gemacht werden kann, denn Daten lassen sich de-anonymisieren und auf unvorhergesehene Weise auswerten. Das verlangt nach einem neuen Verantwortungsbewusstsein.

Daten als Wettbewerbsvorteil Payback-Karten, Bonusprogramme, Kunden-Logins, wohin man schaut – Marketer haben verstanden, wie wertvoll die individuelle Kaufhistorie ist. Wer das individuelle Kaufverhalten seiner Kunden kennt, kann sein Marketing zielgenauer ausrichten. Zudem entstehen auch für den Kunden handfeste Vorteile. Der Erfolg von Netflix beruht zu großen Teilen darauf, dass man durch Kenntnisse über die Sehgewohnheiten treffende Empfehlungen geben kann. Auf diese Weise wird der Empfehlungsalgorithmus von Netflix umso wertvoller für seine Nutzer, je mehr der Dienst über die Vorlieben seiner Mitglieder weiß.

Big Data geht einen Schritt weiter: Dank riesiger Datenmengen lassen sich Rückschlüsse auf Bereiche des Lebens treffen, die ursprünglich gar nicht in den Daten erfasst wurden. Ein Beispiel ist die berühmte Analyse des amerikanischen Händlers Target, bei der man eine schwangere Teenagerin entdeckte, bevor es ihre eigenen Eltern konnten.

Die Basis dabei: Die Kaufhistorie aller Kundinnen. Zuerst wurde ausgewertet, was schwangere Kundinnen gekauft haben. Zu Beginn des zweiten Trimesters bevorzugten viele von ihnen parfümfreie Körperlotionen. Muster wie diese lassen sich anschließend auf alle weiblichen Kunden übertragen. Zeigt eine Frau ein ähnliches Kaufmuster, kann man mit einiger Sicherheit annehmen, dass sie schwanger ist – und ihr Werbung für Baby-Produkte zeigen.

Die Ergebnisse können dabei weit über Produkt-Vorlieben hinausgehen. Wissenschaftler der Cambridge Universität konnten beispielsweise in einer Studie mit 60.000 anonymisierten Facebook-Nutzern sehr intime Details aus ihren Likes extrahieren: Geschlecht, Rasse, sexuelle Orientierung, Alkoholgenuss – viele dieser Eigenschaften sind mit hoher Wahrscheinlichkeit konstruierbar. Homosexualität konnten sie beispielsweise in immerhin 88% der Fälle richtig vorhersagen. Wichtig dabei: Auf den ersten Blick standen die Likes in keinem unmittelbar erkennbaren Zusammenhang. Nur 5% der homosexuellen Teilnehmer gaben beispielsweise offensichtlichen Themen wie „Gleichgeschlechtliche Ehe“ ein Like.

Anonymisierung und De-Anonymisierung

Um solche Vorhersagen treffen zu können, benötigt man Zugang zu einer großen Menge an Daten. Tatsächlich stellen diese Datenmengen viele intuitive Annahmen in Frage, zum Beispiel die Idee, dass wir als Individuum in einer großen Menschenmenge verschwinden und nicht identifiziert werden können. Für Big Data gilt das nicht mehr: Bei der Analyse von Daten vieler Millionen Menschen entstehen individuelle Muster, die umso feiner werden, je mehr Eigenschaften sie umfassen. Auf diese Weise kann das Individuum umso besser identifiziert werden, je mehr Daten analysiert werden können. Das ist besonders der Fall, wenn mehrere Analysen kombiniert werden – irgendwann sind die Muster so deutlich, dass sie eindeutig auf den Einzelnen bezogen werden können.

Eine naheliegende Antwort wäre natürlich, Nutzer um Erlaubnis zur Datensammlung zu bitten. Nur: Wissen wir wirklich, welche Vorhersagen aus unseren Daten abgeleitet werden können – heute und in Zukunft? Was nützt ein Einverständnis, wenn dem Nutzer gar nicht klar war, wozu er sich einverstanden erklärt hat? Für den Berater Jeffrey F. Rayport kommen bei Big Data daher weitere Faktoren hinzu – Unternehmen sollten konkret und nachvollziehbar erklären, welche Analysen mit den erhobenen Daten durchgeführt werden, besonders wenn De-Anonymisierung ermöglicht wird.

Transparenz und Vertrauen schaffen

Für den Philosophen Michael LaBossiere erzeugt Big Data eine andere ethische Dimension beim Umgang mit Daten. Seine Analogie: Wenn ich jemanden verfolge, durch sein Fenster schaue, seine Mülltonnen nach Einkaufszetteln durchwühle, Buch über seine Fahrten zum Altglas-Container führe und schließlich behaupte, er sei ein Alkoholiker – das ist ein eindeutiger Verstoß gegen die Privatsphäre. Analysiere ich jedoch Daten dieser Person und schließe darauf, dass er ein Alkoholiker sein muss, dann ist die moralische Frage nicht mehr so offensichtlich. Das Ergebnis ist identisch, der Weg dorthin anders – nämlich indirekt.

Big Data stellt also neue ethische Fragen: Was dürfen wir mit Daten anfangen? Welche Analysen sind in Ordnung, welche gehen zu sehr ins Private? Fragen wie diese sollten fester Bestandteil bei der Planung von Big-Data-Projekten sein.

Wie das aussehen kann, zeigt das Projekt „Signals“ der Purdue-Universität. Wer daran teilnimmt, erhält basierend auf Big-Data-Analysen mittels eines Ampel-Systems Hinweise darauf, welche Kurse leistungsmäßig auf der Kippe stehen – und kann rechtzeitig gegensteuern. Wie die ethischen Fragen dabei behandelt werden können, erläutern die Wissenschaftler James E. Willis, John P. Campbell und Matthew D. Pistilli in einem ausführlichen Paper. Signals ist damit ein Projekt, das nicht nur zeigt, was Big Data möglich macht, sondern auch, wie unsere Ethik damit Schritt halten kann.


Image (adapted) „Was that a mistake? Project 365(2) Day 160“ by Keith Williamson (CC BY 2.0)


ist Medienwissenschaftler und beobachtet als Autor („Grundkurs Gutes Webdesign“) und Berater den digitalen Wandel. Seine Themenschwerpunkte sind User Experience, anwenderfreundliches Design und digitale Strategien. Er schreibt regelmäßig für Fachmedien wie das t3n Magazin, die Netzpiloten oder Screenguide. Mitglied des Netzpiloten Blogger Networks.


Artikel per E-Mail verschicken
Schlagwörter: , , ,

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert