KI8. Mai 20265 min Lesezeit

KI-Coding mit Codex und Claude

Wie professionelle Teams Codex, Claude Code und KI-Agenten in der Softwareentwicklung einsetzen, ohne Qualität, Architektur und Kontrolle zu verlieren.

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

5 min Lesezeit

KI-Coding ist aus professioneller Softwareentwicklung nicht mehr wegzudenken. Tools wie Codex von OpenAI und Claude Code von Anthropic verändern nicht nur, wie Code geschrieben wird. Sie verändern, wie Teams Aufgaben schneiden, technische Entscheidungen dokumentieren, Tests aufbauen und Pull Requests vorbereiten.

Der entscheidende Punkt: KI ersetzt kein Engineering-System. Sie verstärkt es. Ein Team mit klarer Architektur, guter Dokumentation und verlässlichen Tests profitiert deutlich stärker als ein Team, das unklare Anforderungen in einen Chat wirft und hofft, dass am Ende ein Produkt entsteht.

Dieser Beitrag zeigt, wie Unternehmen KI-Coding pragmatisch einsetzen: mit Codex, Claude, lokalen Regeln, Reviews und einem Workflow, der Geschwindigkeit und Qualität zusammenbringt.

Was Codex und Claude Code leisten

OpenAI beschreibt Codex als Coding Agent, der Code lesen, ändern und ausführen kann. In der Praxis ist das besonders wertvoll für klar abgegrenzte Aufgaben: Bugfixes, Refactorings, Tests, Dokumentation, Migrationen oder die Vorbereitung von Pull Requests.

Claude Code ist ähnlich relevant für Entwicklerteams, besonders dort, wo ein Agent im Projektkontext arbeitet, Dateien ändert, Shell-Kommandos ausführt und größere Codebasen schrittweise analysiert. Beide Werkzeuge sind keine magischen Autopiloten. Sie sind produktive Assistenten, wenn sie genügend Kontext und Grenzen bekommen.

Aufgabe	Gute KI-Nutzung	Menschliche Verantwortung
Feature-Schnitt	Akzeptanzkriterien strukturieren	Produktentscheidung treffen
Implementierung	Boilerplate, Tests, API-Anbindung	Architektur und Randfälle prüfen
Refactoring	Wiederholungen reduzieren, Typen härten	Verhalten und Kompatibilität sichern
Review	Risiken und fehlende Tests markieren	Merge-Entscheidung treffen
Dokumentation	README, Changelog, Migrationsnotizen	Fachliche Korrektheit freigeben

Warum der Prompt nicht der wichtigste Teil ist

Viele Diskussionen über KI-Coding drehen sich um Prompts. Gute Prompts helfen, aber sie sind nicht die Hauptsache. Wichtiger sind Repository-Struktur, Testbarkeit, lokale Konventionen und ein sauberer Aufgabenrahmen.

Ein guter Auftrag für Codex oder Claude enthält:

Ziel: Was soll sich für Nutzer oder Entwickler ändern?
Kontext: Welche Dateien, APIs und Designentscheidungen sind relevant?
Grenzen: Was darf nicht verändert werden?
Qualitätskriterien: Welche Tests, Lint-Regeln oder Screenshots zählen?
Review-Hinweise: Worauf soll der Mensch besonders achten?

Ein schlechter Auftrag lautet: "Baue das Feature." Ein guter Auftrag lautet: "Ergänze im Kontaktformular serverseitige Validierung für Telefonnummern, ändere keine E-Mail-Templates, füge Tests für leere und internationale Nummern hinzu und dokumentiere die Fehlermeldung."

Der professionelle KI-Coding-Workflow

In Kundenprojekten funktioniert KI-Coding am besten als strukturierter Loop.

1. Aufgabe vorbereiten

Bevor ein Agent arbeitet, wird die Aufgabe geschärft: gewünschtes Verhalten, Nicht-Ziele, betroffene Komponenten, Teststrategie. Das spart mehr Zeit als jeder nachträgliche Prompt-Fix.

2. Agent isoliert arbeiten lassen

Der Agent sollte in einem Branch, Workspace oder klar begrenzten Bereich arbeiten. So kann er Dateien ändern, ohne laufende Arbeit zu beschädigen. Für größere Aufgaben lohnt sich die Aufteilung: ein Agent für Tests, einer für UI, einer für Backend-Verhalten.

3. Ergebnis maschinell prüfen

Lint, Typecheck, Unit Tests, E2E-Tests und gegebenenfalls visuelle Prüfungen müssen laufen. KI-generierter Code ist nicht fertig, nur weil er plausibel aussieht.

4. Menschliches Review

Der Mensch prüft nicht jede Zeile wie früher, sondern andere Dinge: Architektur, Seiteneffekte, Sicherheitsgrenzen, Produktlogik, Datenmodell und langfristige Wartbarkeit.

5. Lernen dokumentieren

Wenn ein Agent wiederholt dieselben Fehler macht, gehört die Erkenntnis in lokale Regeln, README-Dateien, Testfälle oder Agent-Instruktionen. So wird das System mit jeder Aufgabe besser.

Codex oder Claude: Muss man sich entscheiden?

Nicht zwingend. Viele Teams werden mehrere KI-Werkzeuge nutzen, weil sie unterschiedliche Stärken und Oberflächen haben. Entscheidend ist weniger der Anbieter als die Governance rundherum.

Für Unternehmen sind diese Fragen wichtiger als Markenpräferenz:

Welche Repositories und Daten darf das Tool sehen?
Wie werden Secrets geschützt?
Können Änderungen nachvollzogen werden?
Gibt es eine Freigabe vor produktiven Aktionen?
Passt das Tool in Git, CI und Projektmanagement?
Lassen sich Ergebnisse mit Tests verifizieren?

Ein Tool, das schnell Code erzeugt, aber schwer kontrollierbar ist, erzeugt am Ende neue Risiken. Ein Tool, das langsamer wirkt, aber sauber in Review, Tests und Dokumentation passt, kann produktiver sein.

Typische Fehler beim KI-Coding

Der erste Fehler ist zu viel Vertrauen. KI kann überzeugend falsche Begründungen liefern, APIs falsch erinnern oder Randfälle übersehen. Deshalb braucht jeder relevante Output eine Prüfung.

Der zweite Fehler ist zu wenig Kontext. Wenn Agenten Architekturentscheidungen nicht kennen, erfinden sie neue Muster. Das führt zu inkonsistentem Code.

Der dritte Fehler ist fehlende Testkultur. Ohne Tests beschleunigt KI vor allem die Menge an Code, nicht die Qualität.

Der vierte Fehler ist "Vibe Coding" in produktiven Systemen. Für Prototypen kann freies Explorieren sinnvoll sein. Für Kundenportale, Zahlungsflüsse, medizinische Workflows oder interne Kernsysteme braucht es Engineering-Disziplin.

Wo KI-Coding sofort Wert bringt

KI-Coding ist besonders stark bei Aufgaben, die klar prüfbar sind:

Tests für bestehendes Verhalten ergänzen
TypeScript-Typen härten
Formularvalidierung sauber machen
API-Clients aktualisieren
Migrationsnotizen erstellen
kleine UI-Zustände vervollständigen
fehlerhafte Imports und Build-Probleme beheben
Dokumentation aus Code ableiten

Schwieriger sind Aufgaben mit unklarer Produktstrategie, tiefer Domänenlogik oder hohen Sicherheitsanforderungen. Dort kann KI vorbereiten, aber nicht entscheiden.

Was Unternehmen organisatorisch ändern müssen

KI-Coding ist nicht nur ein Entwickler-Tool. Es verändert Planung und Kalkulation. Aufgaben können kleiner geschnitten werden. Prototypen entstehen schneller. Reviews werden wichtiger. Dokumentation wird produktiver, weil sie direkt im Arbeitsfluss entsteht.

Das bedeutet aber auch: Projektmanager, Product Owner und Tech Leads müssen besser formulieren, was ein gutes Ergebnis ist. Vage Tickets werden durch KI nicht besser. Sie werden nur schneller umgesetzt.

Fazit: KI-Coding ist ein Prozessvorteil

Codex, Claude Code und ähnliche Werkzeuge sind kein Ersatz für erfahrene Entwickler. Sie sind ein Hebel für Teams, die wissen, was sie bauen wollen und wie Qualität gemessen wird.

Bei hafencity.dev nutzen wir KI-Coding dort, wo es den Entwicklungsprozess verbessert: Analyse, Implementierung, Tests, Refactoring, Dokumentation und Review-Vorbereitung. Für Unternehmen entsteht der größte Nutzen, wenn diese Arbeitsweise Teil einer sauberen KI-Strategie und einer professionellen Softwareentwicklung wird.

Quellen und weiterführende Links

Schlussfolgerung

KI-Coding lohnt sich nicht, weil es einzelne Zeilen schneller schreibt, sondern weil gute Teams Aufgaben besser vorbereiten, parallelisieren, testen und reviewen. Codex und Claude sind stark, wenn sie in klare Engineering-Prozesse eingebettet sind.

Geschrieben von

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

Alle Beiträge

Weitere Beiträge

Engineering

Aktualisiert 9. Mai 2026

Qualität ist messbar: Performance, Barrierefreiheit und SEO bei unserer neuen Website

Ein sauberer Lighthouse-Score ersetzt keine professionelle Prüfung. Er zeigt aber, ob Performance, Accessibility, Best Practices und SEO nicht nur behauptet, sondern tatsächlich umgesetzt werden.

KI

Aktualisiert 8. Mai 2026

KI in der Softwareentwicklung: schneller liefern

KI kann Analyse, Umsetzung, Tests und Dokumentation deutlich beschleunigen. Entscheidend ist ein Workflow, der Geschwindigkeit mit Review, Architektur und Messbarkeit verbindet.

KI

Aktualisiert 8. Mai 2026

KI-Risiken in Softwareprojekten richtig steuern

KI bringt Tempo in Softwareprojekte, aber auch neue Risiken: Datenschutz, Halluzinationen, unsicheren Code, Abhängigkeiten und fehlende Nachvollziehbarkeit.

Nächste Schritte

Lassen Sie uns über Ihr Projekt sprechen

30-minütiges Erstgespräch. Wir besprechen Ihre Ziele, klären offene Fragen und skizzieren den möglichen Projektablauf.

Termin buchen