Seit Andrej Karpathy im Februar 2025 den Begriff „Vibe Coding" prägte, kann fast jeder in einem Nachmittag eine lauffähige Demo zusammenbauen – per Sprachbefehl, ohne eine Zeile selbst zu schreiben. Das ist beeindruckend, und es ist die richtige Art, einen Prototyp zu starten. Die naheliegende Schlussfolgerung lautet trotzdem oft falsch: „Wenn KI das kann, wozu brauchen wir dann noch eine Agentur?"
Die ehrliche Antwort ist unbequem für jede langsame Agentur und gute Nachricht für alle anderen: KI senkt die Einstiegshürde radikal – und hebt zugleich die Messlatte für ein produktionsreifes Produkt. Der Abstand zwischen einer Demo und einem System, dem du Kunden und Daten anvertraust, ist nicht kleiner geworden. Er ist sichtbarer geworden. Und genau dort lebt Senior-Engineering.
Was KI leicht gemacht hat – und was nicht
KI hat das Erstellen einer ersten lauffähigen Version radikal beschleunigt – aber nicht das Bauen eines Produkts. Das ist kein Widerspruch, sondern eine Präzisierung. In einer kontrollierten Studie von GitHub lösten Entwickler eine abgegrenzte Programmieraufgabe mit Copilot 55,8 Prozent schneller (1 Stunde 11 statt 2 Stunden 41). Der DORA-Report 2025 bestätigt das Muster im Großen: KI ist mit mehr erledigten Aufgaben (+21 Prozent) und deutlich mehr gemergten Pull Requests (+98 Prozent) verbunden. Die Kernthese des Reports ist nüchtern und wichtig zugleich: KI verstärkt, was schon da ist.
Genau deshalb ist das Bild differenzierter, als die Demo-Videos suggerieren. In einer randomisierten Studie von METR waren erfahrene Open-Source-Entwickler an ihren eigenen, gut bekannten Projekten mit KI sogar 19 Prozent langsamer – während sie glaubten, schneller zu sein. KI hilft am meisten dort, wo Kontext fehlt, und am wenigsten in Code, den jemand ohnehin tief beherrscht. Die Lehre für ein Produkt: Tempo ist kontextabhängig, und die Demo ist der einfachste Teil.
Das 70-Prozent-Problem
KI bringt dich schnell auf etwa 70 Prozent – die letzten 30 Prozent sind die eigentliche Software-Entwicklung. Diese Beobachtung hat der Google-Engineer Addy Osmani als 70-Prozent-Problem beschrieben, und sie deckt sich mit dem, was wir in Projekten täglich sehen. Die ersten 70 Prozent – das sichtbare UI, der Happy Path, die ersten Features – entstehen mit KI erstaunlich schnell. Die letzten 30 Prozent sind unsichtbar und teuer: Fehlerbehandlung, Grenzfälle, Sicherheit, Performance unter Last, Barrierefreiheit, Wartbarkeit und die Frage, wie das System in zwei Jahren noch änderbar ist.
Der Haken: Diese 30 Prozent sind nicht 30 Prozent des Aufwands, sondern oft der Großteil. Eine Demo, die im Wohnzimmer funktioniert, ist nicht dasselbe wie ein System, das 10.000 Nutzer, ungültige Eingaben, Lastspitzen und Angreifer übersteht. Wer die 70 Prozent für „fast fertig" hält, plant am eigentlichen Projekt vorbei.
Von der Demo zur Produktion: die echte Distanz
Der Abstand zwischen einer überzeugenden Demo und einem System, dem man Kunden anvertraut, ist genau dort, wo Senior-Engineering lebt. Und dieser Abstand zeigt sich inzwischen auch in den Zahlen. Laut dem Stack Overflow Developer Survey 2025 nutzen oder planen 84 Prozent der Entwickler KI-Tools – aber das Vertrauen in deren Korrektheit ist gesunken: Nur noch rund ein Drittel vertraut der Genauigkeit, 46 Prozent misstrauen ihr aktiv. Am aussagekräftigsten ist diese Zahl: 66 Prozent sind von „fast richtigen" KI-Antworten frustriert, und für etwa 45 Prozent dauert das Debuggen von KI-Code länger, als ihn selbst zu schreiben.
„Fast richtig" ist in der Produktion teurer als „offensichtlich falsch", weil es durch oberflächliche Tests rutscht. Das schlägt sich in Vorfällen nieder: In einer Umfrage vom August 2025 berichteten 16 von 18 befragten CTOs von Produktionsincidents, die durch KI-generierten Code verursacht wurden. Der DORA-Report nennt den Mechanismus dahinter: KI-Adoption steht in einem negativen Verhältnis zur Delivery-Stabilität – es sei denn, starke Tests, saubere Versionierung und schnelles Feedback fangen die zusätzliche Geschwindigkeit ab. Tempo ohne Disziplin erzeugt Instabilität, nicht Wert.
Selbst bauen mit KI oder eine KI-native Agentur?
Die ehrliche Gegenfrage lautet nicht „KI oder Agentur", sondern „wer schließt die letzten 30 Prozent verlässlich". Der Einwand „Das bauen wir einfach selbst mit KI" ist legitim – und für einen Prototyp, ein internes Tool oder eine Marktvalidierung oft die richtige Entscheidung. Genau dafür ist Vibe Coding stark. Riskant wird es in dem Moment, in dem aus dem Prototyp ein Produkt werden soll, dem Kunden, Umsätze und personenbezogene Daten anvertraut werden.
| Dimension | Selbst mit KI bauen | KI-native Agentur |
|---|---|---|
| Erste Demo | Stunden bis Tage | Stunden bis Tage |
| Letzte 30 % | offen, ad hoc | systematisch geschlossen |
| Code-Review & Tests | selten | Standard |
| Sicherheit | meist ungeprüft | Review, SAST, Härtung |
| Wartbarkeit & Übergabe | Risiko Tech-Debt | dokumentiert, übergebbar |
| Verantwortung bei Incident | bei dir | vertraglich geregelt |
Wichtig: Die linke Spalte ist nicht „dumm" und die rechte nicht „magisch". Beide starten heute schnell, weil beide KI nutzen. Der Unterschied liegt nicht im Tempo der ersten 70 Prozent, sondern in der Disziplin der letzten 30. Eine KI-native Agentur gibt dir das Tempo weiter – und investiert die gewonnene Zeit in Review, Tests und Architektur, statt in noch mehr ungeprüften Code. Wie dieser Übergang vom Prototyp zum belastbaren System konkret aussieht, beschreiben wir in Vom KI-Prototyp zum produktionsreifen System.
Wofür du eine Agentur jetzt wirklich bezahlst
Du bezahlst nicht mehr fürs Tippen von Code – du bezahlst für das Urteilsvermögen, das aus KI-Tempo ein sicheres Produkt macht. Das ist die eigentliche Verschiebung. Früher steckte ein großer Teil des Agenturwerts im handwerklichen Schreiben von Code. Heute steckt er in den Entscheidungen darum herum: Welche Architektur trägt in zwei Jahren? Wo schlägt KI-generierter Code subtil fehl? Welche Tests beweisen, dass es wirklich funktioniert? Welche Daten dürfen das Haus nicht verlassen?
Diese Arbeit ist nicht kleiner geworden, sie ist wertvoller geworden – denn KI produziert mehr Code, schneller, und damit mehr Fläche, die Review, Tests und Sicherheit braucht. Eine moderne Agentur muss KI deshalb selbst exzellent einsetzen; KI zu verweigern lässt Geschwindigkeit und Qualität liegen. Den Beleg, dass disziplinierter KI-Einsatz schneller und besser liefert, führen wir in KI in der Softwareentwicklung: schneller und besser aus. Die Kehrseite – welche neuen Risiken KI-Code mitbringt und wie man sie absichert – behandeln wir in Risiken der KI-Codegenerierung. Wie wir KI in unsere Entwicklung einbinden, ohne die Kontrolle abzugeben, ist genau dieser dritte Weg: KI plus Engineering-Rigorosität, zusammen als Produkt.
Nächste Schritte
Drei Fragen klären schneller als jede Tool-Debatte, ob du selbst baust oder Unterstützung brauchst:
- Reifegrad: Geht es um einen Prototyp zur Validierung – oder um ein Produkt, dem Kunden und Daten anvertraut werden?
- Die letzten 30 Prozent: Wer übernimmt verlässlich Sicherheit, Tests, Skalierung und Wartung, wenn die Demo steht?
- Verantwortung: Wer haftet, wenn KI-generierter Code in Produktion einen Vorfall auslöst?
Wenn die Antworten Richtung „echtes Produkt" zeigen, lohnt sich ein Gespräch. Wir bauen mit KI schnell – und schließen die letzten 30 Prozent mit der Disziplin, die ein Produkt belastbar macht. Sieh dir unsere Software-Entwicklung an oder buche direkt ein Erstgespräch.




