DSGVO-kon­for­me KI auf der Web­site: Was geht, was nicht

DSGVO-kon­for­me KI ist mög­lich – aber nicht als Pau­schal­ant­wort. Wer Da­ten­fluss und Da­ten­her­kunft trennt, sor­tiert je­den Use-Case in vier Ka­te­go­rien. Drei Haus­auf­ga­ben ent­schei­den, ob das Sys­tem recht­lich be­treib­bar bleibt.
6 Min. LesezeitMatthias RadscheitMatthias Radscheit
Happycodingde-DE

TL;DR

DSGVO-konforme KI auf der Website ist machbar, aber nicht pauschal. Trennen Sie Datenfluss von Datenherkunft, dann fällt jeder Use-Case in eine von vier Kategorien. Drei Hausaufgaben – Trainingsausschluss im Vertrag, technisch erzwungene Einwilligung, durchgängiger Löschpfad bis in den Vector-Store – entscheiden über die rechtliche Betreibbarkeit.

  • Zwei Bruchlinien klären jeden Fall: Datenfluss (wohin fließen Daten, wer verarbeitet sie) und Datenherkunft (wessen Daten landen im Training).
  • Use-Cases sortieren sich in vier Kategorien – unproblematisch, einwilligungspflichtig, vertraglich abzudecken, oder besser gar nicht.
  • Drei Hausaufgaben sind nicht verhandelbar: Trainingsausschluss im AVV, technisch erzwungene Einwilligung vor Aktivierung, ein Löschpfad bis in den Vector-Store.
  • Emotionsanalyse, verhaltensbasiertes Profiling und vollautomatisierte Entscheidungen nach Art. 22 DSGVO baut man bewusst nicht – das Geschäftsziel ist meist auch ohne erreichbar.
  • Die Rechtslage (DPF/Schrems, EU AI Act, Trainingspraxis der Anbieter) ist im Fluss; verlassen Sie sich auf Architektur, nicht auf den aktuellen Tarif eines US-Anbieters.

DSGVO-kon­for­me KI auf der Web­site ist mög­lich – aber nie als Pau­schal­ant­wort, und nie durch das Ein­bin­den ei­nes Chat­bots aus den USA. Wer eine kla­re Li­nie sucht, be­kommt sie, so­bald er zwei Fra­gen sau­ber trennt: Wo­hin flie­ßen die Da­ten, und wo­her stam­men sie.

In je­dem zwei­ten Ge­spräch der letz­ten zwölf Mo­na­te kommt die­se Fra­ge in ir­gend­ei­ner Form: „Kön­nen wir KI auf un­se­rer Web­site ein­set­zen, ohne mit der DSGVO in Kon­flikt zu ge­ra­ten?" Wir sind kei­ne An­wäl­te und er­set­zen kei­ne Rechts­be­ra­tung. Aber wir bau­en seit zwei Jah­ren KI-ge­stütz­te Funk­tio­nen in B2B-Web­sites – Lead-Qua­li­fi­zie­rung, Con­tent-Ge­ne­rie­rung, se­man­ti­sche Su­che – und ha­ben sehr kon­kret da­mit ge­run­gen, was tech­nisch und ver­trag­lich nö­tig ist, da­mit das im eu­ro­päi­schen Rah­men trägt. Wer am Ende recht­li­che Si­cher­heit braucht, spricht trotz­dem mit ei­ner An­wäl­tin. Aber dann mit deut­lich kon­kre­te­ren Fra­gen.

War­um „DSGVO-kon­for­me KI" so sel­ten klar be­ant­wor­tet wird

Die Fra­ge bleibt of­fen, weil sie zwei Din­ge ver­mischt, die ge­trennt ge­hö­ren. Die ers­te Bruch­li­nie ist der Da­ten­fluss: Wel­che Da­ten flie­ßen, wo­hin, und wer ver­ar­bei­tet sie? Dar­aus folgt, ob Sie eine Auf­trags­ver­ar­bei­tung brau­chen, ob ein Dritt­land­trans­fer statt­fin­det, ob Stan­dard­ver­trags­klau­seln grei­fen müs­sen. Die zwei­te Bruch­li­nie ist die Da­ten­her­kunft: Wes­sen Da­ten dür­fen über­haupt ver­ar­bei­tet wer­den, und lan­den sie in den Trai­nings­da­ten ei­nes Mo­dells?

Wer die­se bei­den Ach­sen an­legt, sor­tiert je­den Use-Case in eine von vier Ka­te­go­rien: un­pro­ble­ma­tisch, ein­wil­li­gungs­pflich­tig, ver­trag­lich ab­zu­de­cken – oder bes­ser gar nicht. Das er­setzt das Bauch­ge­fühl durch eine Ent­schei­dungs­lo­gik, die Sie auch vor dem Da­ten­schutz­be­auf­trag­ten oder dem Vor­stand ver­tei­di­gen kön­nen.

Die vier Ka­te­go­rien für je­den KI-Use-Case

Fall 1: Ser­ver-sei­ti­ge KI ohne per­so­nen­be­zo­ge­ne Da­ten. Ein Schlag­wort-Ge­ne­ra­tor, eine Über­set­zung, eine Zu­sam­men­fas­sung re­dak­tio­nel­ler In­hal­te. Hier ist die DSGVO nicht der Eng­pass, weil schlicht kein Per­so­nen­be­zug ent­steht. Trotz­dem gilt: An­bie­ter mit eu­ro­päi­scher Ser­ver-Re­gi­on (An­thro­pic Clau­de, Ope­nAI über Azu­re EU, Mis­tral, Aleph Al­pha), ein sau­be­rer Auf­trags­ver­ar­bei­tungs­ver­trag, eine dis­zi­pli­nier­te API-Schlüs­sel­ver­wal­tung. Das ist die un­pro­ble­ma­ti­sche Ka­te­go­rie – und der über­wie­gen­de Teil des­sen, was Mar­ke­ting-Ab­tei­lun­gen tat­säch­lich wol­len, fällt hier hin­ein.

Fall 2: KI mit Nut­zer­da­ten in Echt­zeit. Chat­bot, se­man­ti­sche Su­che, Lead-Qua­li­fi­zie­rung. So­bald die IP-Adres­se oder der Ein­ga­be­inhalt an ei­nen ex­ter­nen LLM-An­bie­ter fließt, ver­ar­bei­ten Sie per­so­nen­be­zo­ge­ne Da­ten. Was hier trägt: ein do­ku­men­tier­ter Da­ten­fluss­plan, ein Auf­trags­ver­ar­bei­tungs­ver­trag mit dem LLM-An­bie­ter, eine trans­pa­ren­te Da­ten­schutz­er­klä­rung, die An­bie­ter und Art der Da­ten be­nennt, und eine ech­te Ein­wil­li­gung für KI vor der Ak­ti­vie­rung – kein vor­ausge­wähl­tes Ban­ner. Sitzt der An­bie­ter au­ßer­halb der EU, kom­men Stan­dard­ver­trags­klau­seln und eine Dritt­land­trans­fer-Be­wer­tung nach Schrems II hin­zu. Das ist die ein­wil­li­gungs­pflich­ti­ge, ver­trag­lich ab­zu­de­cken­de Ka­te­go­rie.

Fall 3: KI mit lang­fris­ti­ger Da­ten­spei­che­rung. Kon­ver­sa­tio­nen, die „ler­nen", Pro­fi­le, Per­so­na­li­sie­rung. Hier grei­fen Zweck­bin­dung, Da­ten­spar­sam­keit, Spei­cher­be­gren­zung und das Recht auf Aus­kunft und Lö­schung mit vol­ler Wucht. Pseud­ony­mi­sie­ren oder an­ony­mi­sie­ren Sie, wo es geht. De­fi­nie­ren Sie Spei­cher­zei­ten und er­zwin­gen Sie sie au­to­ma­tisch. Und – der Punkt, an dem es tech­nisch ernst wird – hal­ten Sie ei­nen Lösch­pfad be­reit, der auch Em­bed­dings im Vec­tor-Store und die Kon­ver­sa­ti­ons­his­to­rie er­fasst. Wer pg­vec­tor als KI-Ba­ckend ein­setzt, muss die­sen Pfad mit­den­ken, sonst bleibt die Lö­schung Theo­rie; wir ha­ben die Ar­chi­tek­tur da­hin­ter an an­de­rer Stel­le aus­führ­lich be­schrie­ben.

Fall 4: KI, die wir nicht emp­feh­len. Dazu gleich ein ei­ge­ner Ab­schnitt – die­se Ka­te­go­rie ver­dient mehr als eine Zei­le.

Der oft über­se­he­ne Punkt: Trai­nings­da­ten

Wer­den die an ei­nen LLM-An­bie­ter ge­schick­ten Da­ten zum Trai­ning ver­wen­det? Bei den gro­ßen An­bie­tern – Ope­nAI, An­thro­pic, Goog­le – ist die Ant­wort in B2B-, API- und En­ter­pri­se-Ta­ri­fen stan­dard­mä­ßig nein. In Con­su­mer-Ta­ri­fen nicht, und die Pra­xis kann sich än­dern. Ge­nau des­halb ge­hört der Trai­nings­aus­schluss vor je­der In­te­gra­ti­on in den Ver­trag und nicht in die An­nah­me.

Wir be­vor­zu­gen An­bie­ter, die den Trai­nings­aus­schluss als Stan­dard kom­mu­ni­zie­ren, statt ihn als Pre­mi­um-Op­ti­on zu ver­kau­fen. Das ist kein De­tail für die Rechts­ab­tei­lung, son­dern ein Ar­gu­ment, das di­rekt in die Da­ten­schutz­er­klä­rung wan­dert und das Sie ge­gen­über Kun­den ver­tre­ten kön­nen. Wer hier auf den Good­will ei­nes US-An­bie­ters baut, baut auf Sand – die Dis­kus­si­on, ob eu­ro­päi­sche Da­ten auf US-In­fra­struk­tur über­haupt si­cher lie­gen, ist nicht ab­ge­schlos­sen, Stich­wort CLOUD Act und die Fra­ge nach der Da­ten­sou­ve­rä­ni­tät.

Wel­che KI-Funk­tio­nen man be­wusst nicht baut

Hier wird die ehr­li­che Ant­wort un­be­quem. Drei Klas­sen von Funk­tio­nen las­sen sich tech­nisch bau­en, soll­ten es aber nicht.

Emo­ti­ons­ana­ly­se und ver­hal­tens­ba­sier­tes Pro­fil­ing über Web­cam, Mi­kro­fon oder Ein­ga­be­mus­ter er­zwin­gen fast im­mer eine Da­ten­schutz-Fol­gen­ab­schät­zung, sind schwer zu be­stehen und ge­sell­schaft­lich ne­ga­tiv auf­ge­la­den. Der EU AI Act ver­schärft die­se Li­nie zu­sätz­lich: Emo­ti­ons­er­ken­nung am Ar­beits­platz und im Bil­dungs­kon­text fällt un­ter die ver­bo­te­nen Prak­ti­ken, und bio­me­tri­sche Ka­te­go­ri­sie­rung gilt als Hoch­ri­si­ko-An­wen­dung mit er­heb­li­chen Pflich­ten. Sie ad­die­ren also eine zwei­te Re­gu­lie­rungs­di­men­si­on oben auf die DSGVO – Stand Mit­te 2026, die Über­gangs­fris­ten sind zu prü­fen.

Die drit­te Klas­se sind voll­au­to­ma­ti­sier­te Ent­schei­dun­gen mit recht­li­cher Wir­kung – etwa ein Lead-Scoring, das Zu­gang oder Kon­di­tio­nen steu­ert. Das ist der An­wen­dungs­be­reich von Art. 22 DSGVO, der sol­che Ent­schei­dun­gen grund­sätz­lich an enge Be­din­gun­gen knüpft. Un­se­re Emp­feh­lung in al­len drei Fäl­len: Prü­fen Sie zu­erst, ob das Ge­schäfts­ziel ohne die­se Me­cha­nik er­reich­bar ist. In neun von zehn Fäl­len ist es das.

Und dann ist da der wirk­lich schwie­ri­ge Teil, der in kei­ner Ver­trags­vor­la­ge steht: der Lösch­pfad. Eine Lösch­an­fra­ge nach Art. 17 DSGVO muss die Da­ten über­all er­rei­chen – in der Haupt­da­ten­bank, in der Kon­ver­sa­ti­ons­his­to­rie und in den Em­bed­dings des Vec­tor-Stores. Ge­nau dort schei­tern Sys­te­me in der Pra­xis, weil der Vec­tor-Store als nach­ge­la­ger­ter In­dex oft ver­ges­sen wird. Dazu kommt, dass die Rechts­la­ge selbst in Be­we­gung ist: Das Ver­hält­nis von Data Pri­va­cy Frame­work und Schrems, die Trai­nings­pra­xis der An­bie­ter, die Aus­le­gung des AI Act – nichts da­von ist end­gül­tig sor­tiert. Wer hier auf ei­nen Stich­tag baut, baut falsch.

Das prag­ma­ti­sche Vor­ge­hen vor je­der In­te­gra­ti­on

Be­vor eine Zei­le In­te­gra­ti­ons­code ent­steht, be­ant­wor­ten wir fünf Fra­gen in die­ser Rei­hen­fol­ge. Ers­tens: Wel­che Da­ten flie­ßen wirk­lich – vom Klick bis zur Ant­wort lü­cken­los auf­ge­zeich­net? Zwei­tens: Wel­cher An­bie­ter, eu­ro­pä­isch ge­hos­tet und mit Trai­nings­aus­schluss? Drit­tens: Wel­che Ver­trags­grund­la­ge – AVV, ge­ge­be­nen­falls Stan­dard­ver­trags­klau­seln, Dritt­land­trans­fer-Be­wer­tung? Vier­tens: Wel­che Ein­wil­li­gung, tech­nisch er­zwun­gen vor Ak­ti­vie­rung? Fünf­tens: Wie sieht der Lösch­weg aus – wo lie­gen die Da­ten über­all, und wie kom­men sie rest­los weg?

Der fünf­te Punkt ist der am häu­figs­ten ver­ges­se­ne und gleich­zei­tig der bes­te Lack­mus­test für die tech­ni­sche Rei­fe ei­nes Teams. Wer den Lösch­pfad nicht zeich­nen kann, hat die Ar­chi­tek­tur nicht ver­stan­den. Die­sel­be Fra­ge nach Da­ten­ho­heit und Spei­cher­ort stellt sich üb­ri­gens schon eine Ebe­ne tie­fer, beim Ba­ckend selbst – wel­che Ar­chi­tek­tur die­se Kon­trol­le über­haupt er­mög­licht, be­han­deln wir auf un­se­rer Über­sicht zur Su­pa­ba­se-Ar­chi­tek­tur.

Was ich Ent­schei­dern rate

Ver­las­sen Sie sich nicht auf die Com­pli­ance-Aus­sa­ge ei­nes ein­zel­nen An­bie­ters, son­dern auf eine Ar­chi­tek­tur, die drei Din­ge er­zwingt: den Trai­nings­aus­schluss im Ver­trag, die Ein­wil­li­gung tech­nisch vor der Ak­ti­vie­rung, und ei­nen Lösch­pfad, der je­den Spei­cher­ort bis in den Vec­tor-Store er­reicht. Die­se drei Haus­auf­ga­ben sind nicht ver­han­del­bar – sie ent­schei­den, ob das Sys­tem recht­lich be­treib­bar bleibt, wenn die Rechts­la­ge sich das nächs­te Mal ver­schiebt.

Der Rest ist Sor­tier­ar­beit. Tren­nen Sie Da­ten­fluss und Da­ten­her­kunft, ord­nen Sie je­den Use-Case in die vier Ka­te­go­rien ein, und strei­chen Sie die vier­te ohne Dis­kus­si­on. Wer so vor­geht, be­treibt KI auf der Web­site nicht trotz der DSGVO, son­dern in ei­ner Form, die er vor dem Vor­stand und vor der Auf­sichts­be­hör­de glei­cher­ma­ßen ver­tre­ten kann. Das ist kein ju­ris­ti­sches Kunst­stück, son­dern En­gi­nee­ring-Hy­gie­ne.

Häufige Fragen

Ist DSGVO-konforme KI auf der Website überhaupt möglich?
Ja, aber nicht als Pauschalantwort. Entscheidend ist, welche Daten wohin fließen und ob sie im Training landen. Server-seitige KI ohne Personenbezug ist unkritisch; ein Chatbot, der Nutzereingaben an einen externen LLM schickt, braucht AVV, transparente Datenschutzerklärung, echte Einwilligung und bei Nicht-EU-Anbietern eine Drittlandtransfer-Bewertung.
Brauche ich für ein LLM einen Auftragsverarbeitungsvertrag?
Sobald personenbezogene Daten – auch nur die IP oder der Eingabeinhalt – an einen externen LLM-Anbieter fließen, ja. Der AVV regelt die Auftragsverarbeitung. Bei Anbietern außerhalb der EU kommen Standardvertragsklauseln und eine Drittlandtransfer-Bewertung nach Schrems II hinzu. Prüfen Sie im selben Schritt, ob ein Trainingsausschluss vertraglich zugesichert ist.
Was ist der häufigste Fehler beim Datenschutz von KI-Funktionen?
Der vergessene Löschpfad. Viele Teams setzen Einwilligung und AVV sauber um, können aber bei einer Löschanfrage nach Art. 17 DSGVO die Daten nicht vollständig entfernen, weil Embeddings im Vector-Store und Konversationshistorien außerhalb der Hauptdatenbank liegen. Der Löschpfad muss von Anfang an alle Speicherorte erfassen.
Welche KI-Funktionen sollte man bewusst nicht bauen?
Emotionsanalyse, verhaltensbasiertes Profiling über Webcam, Mikrofon oder Eingabemuster und vollautomatisierte Entscheidungen mit rechtlicher Wirkung nach Art. 22 DSGVO. Diese Funktionen erzwingen meist eine Datenschutz-Folgenabschätzung, sind schwer zu rechtfertigen und kollidieren zunehmend mit dem EU AI Act. In neun von zehn Fällen ist das Geschäftsziel auch ohne sie erreichbar.

Quellen

Ähnliche Artikel

Offen für ausgewählte Projekte

Lassen Sie uns über Ihr Projekt sprechen

Bu­chen Sie ei­nen un­ver­bind­li­chen Ter­min, schrei­ben Sie uns eine E-Mail oder nut­zen Sie das For­mu­lar – wir freu­en uns auf Ihre Nach­richt.

150+
Abgeschlossene Projekte
15
Jahre Erfahrung
8
Senior‑Level Teammitglieder