DENZERAI

So darf eine KI mit deinen Kundendaten arbeiten, ohne die DSGVO zu brechen

Fast jeder Betrieb will irgendwann dasselbe: einfach die KI fragen können, was im CRM steht. Der Reflex danach ist Angst vor dem Datenschutz, und die ist berechtigt. Der Hebel ist aber nicht, das Modell lokal zu betreiben, sondern die personenbezogenen Daten zu maskieren, bevor das Modell sie überhaupt sieht. Wie das geht, und wo es ehrlich an Grenzen stößt.

Christian Denzer Datenschutz · Betrieb

Das klingt harmlos, bis der Datenschutz fragt

„Frag einfach dein CRM" ist eine der besten Demos, die man einem Betrieb zeigen kann. Du tippst „welche Kunden aus Husum haben seit März nichts mehr bestellt" und bekommst eine saubere Liste. Alle nicken, alle wollen das haben.

Das Problem steckt nicht im Chat, sondern in dem, was dabei passiert. Sobald Namen, Adressen, Telefonnummern, Rechnungsbeträge oder gar Gesundheits- und Personaldaten an ein Cloud-Modell gehen, ist das eine Verarbeitung personenbezogener Daten. Dann brauchst du eine Rechtsgrundlage, einen Auftragsverarbeitungsvertrag mit dem Anbieter, und bei vielen Anbietern landet die Anfrage in einem Drittland. Der schöne Chat ist der einfache Teil. Ihn so zu bauen, dass du ihn einem Kunden verantwortbar hinstellen kannst, ist der eigentliche Teil.

Der erste Reflex ist meistens der falsche

Die häufigste Antwort darauf ist: dann betreiben wir das Modell eben lokal, dann verlässt nichts das Haus. Das ist legitim, ich habe selbst darüber geschrieben, wann sich lokale Modelle lohnen. Aber lokal ist teurer, oft schwächer und löst gar nicht die Frage, um die es hier geht.

Denn die Frage ist nicht wo das Modell läuft, sondern was es zu sehen bekommt. Auch ein lokales Modell will man nicht ungefiltert mit Klarnamen und Kontonummern füttern, sobald Logs, Backups oder ein zweiter Dienst ins Spiel kommen. Wer beim Hosting stehenbleibt, hat den falschen Hebel angefasst.

Maskieren, bevor das Modell etwas sieht

Der richtige Hebel heißt Pseudonymisierung. Die DSGVO meint damit, personenbezogene Daten so zu verarbeiten, dass sie ohne eine separat aufbewahrte Zuordnung keiner Person mehr zugeordnet werden können (Art. 4 Nr. 5). Übersetzt für den Betrieb: zwischen deine Daten und das Modell gehört eine kleine Schleuse, die echte Werte durch Platzhalter ersetzt. Genau so eine Schleuse baue ich gerade in ein lokales CRM ein, und sie hat drei Schichten.

Was wirklich am Modell ankommt

An einem Satz wird der Unterschied am schnellsten klar. Aus einer CRM-Notiz wird auf dem Weg zum Modell das hier:

Was im CRM steht Ruf Herrn Müller, Lessingstraße 4, wegen Rechnung 2026-0042 an.
↓ Schleuse ersetzt
Was das Modell sieht Ruf [PERSON_1], [ADRESSE_1], wegen Rechnung [BELEG_1] an.

Das Modell formuliert seine Antwort mit den Platzhaltern, beim Zurückspielen werden sie wieder aufgelöst. Selbst wenn die Anfrage durch ein Cloud-Modell in einem Drittland läuft, hat dieser Dienst nie einen echten Namen, eine echte Adresse oder eine echte Belegnummer verarbeitet. Genau das ist der Punkt, an dem aus „Chat mit dem CRM" etwas wird, das man einem Kunden hinstellen kann.

Wo es nicht reicht, ehrlich gesagt

Die Schleuse ist kein Freifahrtschein, und es wäre unseriös, sie als einen zu verkaufen.

Ich weiß noch nicht, ob jeder Betrieb alle drei Schichten braucht. Wer nur strukturierte Stammdaten abfragt, kommt oft mit Regex und getrennter Zuordnung weit. Sobald aber Freitext im Spiel ist, Notizen, Mails, Gesprächsprotokolle, reicht die Mustererkennung allein nicht mehr, dann gehört die zweite Schicht dazu.

Fazit

Wenn du eine KI auf deine Kundendaten lassen willst, ist die wichtigste Komponente nicht das Modell und nicht der Chat, sondern die Schleuse davor. Fang klein an: Mustererkennung für die eindeutigen Felder, eine getrennt liegende Zuordnungstabelle, ein sauberer Auftragsverarbeitungsvertrag. Die Namens- und Orterkennung baust du dazu, sobald Freitext mitspielt. Und versprich niemandem hundert Prozent, auch dir selbst nicht. Wer die Schleuse überspringt, baut eine hübsche Demo, die er keinem Kunden verantwortbar hinstellen kann. Wer sie baut, hat den Teil gelöst, an dem die meisten KI-Projekte im Mittelstand hängenbleiben.

AI Sprint in Husum

Halbtag, 349 Euro, 10 Plätze. Wir schauen deine Abläufe an und klären, welche davon du mit KI anfassen kannst, ohne dir ein Datenschutzproblem zu bauen.

Platz sichern

Quellen: DSGVO Art. 4 Nr. 5 (Pseudonymisierung) und Art. 32 (Sicherheit der Verarbeitung). Werkzeug: Microsoft Presidio (offen, MIT-Lizenz). Eigene Erfahrung aus dem Bau einer solchen Schleuse für ein lokales CRM, Juni 2026.