Ist von KI generierter Code unsicher?

Häufiger als viele denken. Im Veracode GenAI Code Security Report 2025 enthielten 45 % der von KI generierten Code-Samples mindestens eine Schwachstelle aus den OWASP Top 10, bei Aufgaben wie XSS- oder Log-Injection-Schutz lag die Fehlerrate noch höher. Wichtig: Das ist kein Grund, KI zu meiden, sondern ein Grund, jeden KI-Beitrag wie jeden anderen Code zu reviewen, zu scannen und zu testen.

Was ist Slopsquatting?

Slopsquatting ist ein Supply-Chain-Angriff, der KI-Halluzinationen ausnutzt. Eine Studie von 2025 fand, dass rund 19,7 % der untersuchten Code-Samples ein nicht existentes Paket referenzierten – und etwa 43 % dieser erfundenen Namen tauchten bei jeder Wiederholung erneut auf. Greift ein Angreifer einen solchen Namen vorab ab und veröffentlicht ein Schadpaket unter diesem Namen, installiert ein unaufmerksames Team es ungeprüft.

Sollte eine Agentur überhaupt KI zur Codegenerierung nutzen?

Ja – aber diszipliniert. KI beschleunigt erfahrene Teams messbar und gehört 2026 zum Handwerk. Entscheidend ist, dass die Agentur die Risiken kennt und abfedert: Code-Review im Vier-Augen-Prinzip, automatische Security-Scans, Dependency-Kontrolle, Tests und klare Datengrenzen. Eine Agentur, die KI gar nicht nutzt, verschenkt Tempo; eine, die sie naiv nutzt, ist gefährlich.

Erhöht KI-Code die technischen Schulden?

Es gibt Signale dafür. Die GitClear-Analyse 2025 zeigt, dass der Code-Churn – Code, der binnen zwei Wochen wieder verworfen wird – von 3,1 % (2020) auf 5,7 % (2024) gestiegen ist, parallel zu deutlich mehr kopiertem statt refaktoriertem Code. Ohne Review- und Test-Disziplin wandert dieser Aufwand als Wartungslast in die Zukunft.

Darf ich proprietären Code in ein KI-Tool eingeben?

Nur mit klaren Datengrenzen. Wer Quellcode oder Kundendaten an ein externes Modell sendet, muss Vertragslage, Datenschutz (DSGVO) und die geltenden Pflichten des EU AI Act berücksichtigen. Praktisch heißt das: definierte Tool-Liste, kein Training auf deinen Daten, sensible Repositories bleiben außen vor – Punkte, die eine Agentur vertraglich und technisch absichert.

Woran erkenne ich eine disziplinierte KI-Agentur?

Sie kann erklären, wie KI in ihren Workflow eingebettet ist: Review-Pflicht für jede KI-Zeile, SAST-/Security-Scans im CI, eine Dependency-Allowlist gegen halluzinierte Pakete, Tests als Gate und dokumentierte Datengrenzen. Wer stattdessen mit Tempo und „vibe coding" wirbt, ohne über Absicherung zu sprechen, verlagert das Risiko auf dich.

Kontakt

Alle Beiträge

KI29. Juni 20267 min Lesezeit

Risiken der KI-Codegenerierung – und wie eine Agentur sie absichert

KI generiert Code in Sekunden – aber 45 % der Samples enthalten Sicherheitslücken, knapp 20 % verweisen auf erfundene Pakete, und der Code-Churn steigt. Die Gefahr ist nicht die KI, sondern naive KI-Nutzung. Wir zeigen die neuen Risikoklassen mit Zahlen – und die Disziplin, mit der eine Agentur KI zum sicheren Beschleuniger macht.

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

7 min Lesezeit

KI schreibt heute Code in Sekunden – und genau das ist die Versuchung wie das Risiko. Der Veracode GenAI Code Security Report 2025 hat über 100 Modelle bei mehr als 80 Coding-Aufgaben getestet: In 45 % der erzeugten Code-Samples steckte mindestens eine Schwachstelle aus den OWASP Top 10. Neuere oder größere Modelle schnitten dabei nicht besser ab – das Problem ist strukturell, nicht eine Frage des nächsten Releases.

Das ist kein Argument gegen KI. Es ist ein Argument gegen unkontrollierte KI. Wer KI in der Softwareentwicklung naiv einsetzt, importiert neue Risikoklassen direkt in die Produktion. Wer sie diszipliniert einsetzt, gewinnt Tempo, ohne die Kontrolle abzugeben. Dieser Unterschied – Disziplin – ist die eigentliche Leistung einer Agentur.

Die neuen Risikoklassen – mit Zahlen

KI verschiebt nicht nur das Tempo, sie verschiebt das Risikoprofil. Drei Effekte sind belegbar und für jeden relevant, der KI-generierten Code in Produktion bringt: unsicherer Code, halluzinierte Abhängigkeiten und steigender Code-Churn. Dazu kommt eine vierte, vertragliche Klasse: Daten- und IP-Abfluss.

Drei Risikokennzahlen: 45 Prozent der KI-Code-Samples mit Schwachstelle, 19,7 Prozent mit erfundenen Paketen, Code-Churn von 3,1 auf 5,7 Prozent. — Die drei messbaren Risikoklassen der KI-Codegenerierung. Quellen: Veracode 2025, Slopsquatting-Studie 2025, GitClear 2025.

Der unsichere Code ist der direkteste Effekt: 45 % Schwachstellenquote bedeutet nicht, dass jede zweite Zeile kaputt ist, sondern dass bei knapp der Hälfte der gelösten Aufgaben eine ausnutzbare Lücke übrig blieb. Halluzinierte Pakete sind subtiler: Modelle erfinden Bibliotheksnamen, die plausibel klingen, aber nicht existieren. Laut einer in BleepingComputer zusammengefassten Studie referenzierten rund 19,7 % der Samples ein solches Paket – und weil sich die Namen wiederholen, kann ein Angreifer sie registrieren und Schadcode unterschieben („Slopsquatting"). Der Code-Churn schließlich ist das leiseste Signal: Laut GitClear wird mehr Code kurz nach dem Schreiben wieder verworfen und häufiger kopiert statt sauber refaktoriert – ein Frühindikator für Wartungslast.

Risikoklasse	Was passiert	Befund	Gegenmittel
Unsicherer Code	OWASP-Schwachstellen im Output	45 % der Samples (Veracode 2025)	Review + SAST/Security-Scan
Halluzinierte Pakete	erfundene Abhängigkeiten	19,7 % der Samples (Slopsquatting)	Dependency-Allowlist + Pinning
Code-Churn / Tech-Debt	kopiert statt refaktoriert	3,1 % → 5,7 % (GitClear)	Tests, CI-Gates, Architektur
Daten- / IP-Abfluss	Code an externe Modelle	DSGVO & EU AI Act	klare Datengrenzen

Warum naive KI-Nutzung in der Produktion zubeißt

Der gefährlichste Moment ist nicht der Prototyp, sondern der Tag, an dem ungeprüfter KI-Code live geht. KI ist exzellent darin, etwas zu erzeugen, das fast richtig ist – und „fast richtig" ist in der Produktion die teuerste Kategorie. Im Stack Overflow Developer Survey 2025 nennen 66 % der Entwickler genau das als größte Frustration; für rund 45 % dauert das Debuggen von KI-Code länger als es selbst zu schreiben. Das Tempo am Anfang täuscht über die Kosten am Ende hinweg.

Diese Dynamik ist auch auf Team-Ebene messbar. Der DORA-Report 2025 bestätigt einerseits, dass KI die Produktivität verstärkt – mehr erledigte Aufgaben, mehr gemergte Pull Requests. Andererseits zeigt er eine negative Beziehung zwischen KI-Adoption und Lieferstabilität, solange kein starkes Fundament aus automatisierten Tests, Versionskontrolle und schnellem Feedback existiert. KI verstärkt, was schon da ist: Wo Disziplin fehlt, verstärkt sie die Instabilität. Wo Disziplin existiert, verstärkt sie die Qualität. Genau diese Logik haben wir in Risiken in KI-Softwareprojekten und Governance ausführlicher beschrieben.

Die Absicherung: der Stack, den eine Agentur dazwischenschaltet

Jede einzelne Risikoklasse hat ein etabliertes Gegenmittel – die Kunst ist, sie als verbindlichen Layer zu betreiben, nicht als guten Vorsatz. Eine Agentur, die KI ernst nimmt, behandelt KI-Output wie Code eines neuen Teammitglieds: nützlich, aber nie ungeprüft im Merge. Darüber liegt ein Governance-Layer, der eine einfache Regel durchsetzt – KI ist Werkzeug, der Mensch entscheidet und haftet.

Absicherungs-Stack mit Governance-Layer in Lime und sechs Schutzmaßnahmen: Code-Review, SAST-Scan, Dependency-Allowlist, Tests, Datengrenzen, IP-Prüfung. — Der Absicherungs-Stack: ein Governance-Layer über sechs konkreten Schutzmaßnahmen macht KI-Code produktionssicher.

Konkret sind das sechs Maßnahmen, die ineinandergreifen:

Code-Review im Vier-Augen-Prinzip: Keine KI-generierte Zeile geht ohne menschliche Freigabe in den Hauptzweig. Das fängt sowohl die 45-%-Schwachstellen als auch subtile Logikfehler ab.
SAST & Security-Scan im CI: Automatische OWASP-Checks bei jedem Merge, damit Sicherheit nicht von Tagesform abhängt.
Dependency-Allowlist & Pinning: Nur freigegebene, versionsfixierte Pakete – die direkte Antwort auf Slopsquatting. Snyk empfiehlt hier verifizierte Quellen und Lockfiles als Standard.
Tests & CI-Gates: Automatisierte Tests sind das Fundament, das laut DORA über Stabilität entscheidet – sie verwandeln Tempo in verlässliche Releases.
Daten- & Secret-Grenzen: Definierte Tool-Liste, kein proprietärer Code an fremde Modelle, keine Secrets in Prompts.
Lizenz- & IP-Prüfung: Herkunft und Lizenzlage des Outputs werden geklärt, bevor er ausgeliefert wird.

Wie diese Praktiken in einem strukturierten Review zusammenkommen, zeigt unser Software-Audit & Code-Review.

Daten, IP und der EU AI Act

Sobald proprietärer Code ein externes Modell verlässt, wird aus einem Technik- ein Rechtsthema. Zwei Fragen sind zu klären: Was passiert mit den Daten, die du an das Modell sendest – und wem gehört der Output? Praktisch heißt das, eine klare Trennlinie zu ziehen: Welche Repositories dürfen KI-Tools sehen, welche nicht; ob der Anbieter auf deinen Daten trainiert; und ob Secrets oder Kundendaten überhaupt in die Nähe eines Prompts kommen.

Dazu kommt der regulatorische Rahmen. Der EU AI Act ist seit dem 1. August 2024 in Kraft und wird gestaffelt wirksam; je nach Einsatz entstehen Dokumentations- und Transparenzpflichten. Für die Codegenerierung selbst bedeutet das selten dramatische Hürden, aber eine klare Erwartung: nachvollziehbare Prozesse, dokumentierte Tool-Nutzung, saubere Datengrenzen. Eine Agentur, die KI professionell nutzt, hat diese Grenzen vertraglich und technisch ohnehin gezogen.

Woran du eine disziplinierte KI-Agentur erkennst

Der Unterschied zwischen einem Profi und einem „Vibe-Coder" zeigt sich nicht im Tempo, sondern in der Frage nach der Absicherung. Frag konkret nach – die Antworten sind ein zuverlässiger Filter:

Geht jede KI-generierte Zeile durch Review, oder nur „die wichtigen"?
Laufen Security-Scans automatisch im CI, oder gelegentlich von Hand?
Gibt es eine Dependency-Allowlist und Lockfiles gegen halluzinierte Pakete?
Sind Tests ein verbindliches Gate, das Merges blockiert?
Existieren dokumentierte Datengrenzen – welcher Code welches Tool sehen darf?

Wer hier mit „natürlich, so arbeiten wir" und konkreten Beispielen antwortet, nutzt KI als das, was sie ist: ein Beschleuniger im Rahmen solider Technik. Wer ausweicht oder nur über Geschwindigkeit spricht, verlagert das Risiko auf dein Produkt. Mehr dazu, wie sich KI sauber in den Entwicklungsalltag einbettet, steht in KI-Coding mit Codex und Claude sowie in unseren Schwester-Beiträgen Wie eine Agentur mit KI schneller liefert und Ersetzt KI die Software-Agentur?.

Nächste Schritte

Drei Fragen zeigen schnell, ob dein KI-Code abgesichert ist:

Review: Geht jede KI-generierte Zeile durch ein menschliches Code-Review, bevor sie live geht?
Supply Chain: Schützt eine Dependency-Allowlist mit Pinning vor halluzinierten oder untergeschobenen Paketen?
Datengrenzen: Ist klar geregelt, welcher Code welches KI-Tool sehen darf – und was mit deinen Daten passiert?

Wenn eine dieser Fragen unbeantwortet bleibt, lohnt ein Blick von außen. Wir setzen KI in Projekten produktiv ein – mit genau dieser Absicherung. Sieh dir unsere KI-Integration und Entwicklung an oder buche direkt ein Erstgespräch.

Häufige Fragen

Fazit

KI-Codegenerierung führt neue Risikoklassen ein: unsicherer Code, halluzinierte Abhängigkeiten, mehr Tech-Debt und Datenabfluss. Keines davon ist ein Argument gegen KI – sie sind ein Argument gegen unkontrollierte KI. Die Disziplin, die eine gute Agentur ohnehin lebt (Review, Security-Scans, Dependency-Kontrolle, Tests, klare Datengrenzen), macht KI vom Liability zum sicheren Beschleuniger. Genau dafür zahlst du eine Agentur, die KI beherrscht.

Geschrieben von

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

Alle Beiträge

Weitere Beiträge

Sicherheit

Aktualisiert 9. Juli 2026

Kostenloser Security-Check: Software sicher prüfen lassen

Wer nach einem kostenlosen Security-Check sucht, will wissen, ob die eigene Software sicher ist – ohne gleich ein teures Audit zu beauftragen. Wir erklären ehrlich, was ein kostenloser Check leisten kann, wo seine Grenzen liegen und woran Sie seriöse Angebote von getarnten Verkaufsgesprächen unterscheiden.

Business

Aktualisiert 30. Juni 2026

Build, Buy oder Agentur? Die Software-Entscheidung im Mittelstand

Standardsoftware kaufen, selbst entwickeln oder mit einer Agentur bauen? Die Entscheidung ist im Mittelstand selten binär. Wir zeigen mit aktuellen Zahlen, wann welcher Weg trägt – und warum der Partner-Weg Tempo und Kapazität liefert, ohne dass Sie das Eigentum an Ihrer Software aufgeben.

KI

Aktualisiert 30. Juni 2026

EU AI Act im Mittelstand: Auch wer KI nur nutzt, hat Pflichten

Viele Geschäftsführer glauben, der EU AI Act betreffe nur, wer KI baut. Falsch: Schon wer KI einsetzt – im Recruiting, im Service-Chatbot, beim Scoring – ist Betreiber und hat Pflichten. Wir erklären, wer betroffen ist, welche Pflichten ab wann gelten und wie Compliance-by-design aus einer Belastung ein Nicht-Ereignis macht.

Nächste Schritte

Lassen Sie uns über Ihr Projekt sprechen

30-minütiges Erstgespräch. Wir besprechen Ihre Ziele, klären offene Fragen und skizzieren den möglichen Projektablauf.

Termin buchen

Buchungskalender (Cal.com)

Dieser Bereich bindet den externen Dienst Cal.com ein. Mit dem Laden stimmen Sie zu, dass eine Verbindung zu Cal.com hergestellt und dabei Daten in die USA übertragen werden können.

Datenschutzerklärung