Eval-Suiten
Wir bauen domänenspezifische Test-Sets aus realen Beispielen — automatisch ausgewertet, mit klarem Pass-Kriterium pro Use-Case.
Prompt Engineering
Wir behandeln Prompts wie Software: mit Eval-Suite, Diff-Workflow und CI. So liefert Ihr Modell konstante Qualität, statt situativ zu glänzen.
Iteration
Drei Versionen desselben Prompts, drei Eval-Durchläufe, drei messbare Schritte. So sehen unsere Iterationen aus.
Leistungen
Prompt-Engineering ist mehr als Wortwahl. Es ist Test-Disziplin, Architektur und Wissensmanagement in einem.
Wir bauen domänenspezifische Test-Sets aus realen Beispielen — automatisch ausgewertet, mit klarem Pass-Kriterium pro Use-Case.
Rollen, Output-Schemas, Tool-Spezifikationen und Few-Shot-Strategien — sauber getrennt, versioniert, im Repo.
Wir übergeben das Wissen — Playbooks, interne Trainings und Review-Sessions — damit Ihr Team Prompts selbst weiterentwickelt.
Diff-Beispiel
Jede Änderung lebt in einem Pull Request, läuft durch die Eval-Suite und landet erst dann in main, wenn die Werte passen.
<task>- Fasse das Ticket zusammen.</task>- Antwort:
<role>support_lead</role>+ <task>Fasse das Ticket in 3 Sätzen zusammen.</task>+ <output_schema>+ { summary: string, urgency: "low"|"med"|"high" }+ </output_schema>
Eval-Ergebnis
Eval-Suite mit 240 realen Tickets aus dem Service eines mittelständischen Mobilitätsanbieters — ohne neues Modell, nur durch Prompt-Arbeit.
Pass-Quote
42%→93%+51pp
Schema-Treue
55%→99%+44pp
Halluzinationen
18%→3%-15pp
Tonalität (Markenfit)
60%→91%+31pp
Kosten / 1k Aufrufe
62 €→31 €-31 €
In Zahlen
Entwickler, Designer und Strategen aus unserem Hamburger HQ — eingespielt als ein Team.
Unternehmen aus Consumer, Healthcare und B2B vertrauen uns ihre digitalen Produkte an. Langfristige Partnerschaften sind die Regel, nicht die Ausnahme.
Wiederkehrende Engagements und Referenzen, die unsere Kunden tatsächlich anrufen. Vertrauen wächst, wenn Lieferung stimmt.
Maßgeschneiderte Mobile- und Web-Produkte vom Konzept bis zur Wartung — Ende-zu-Ende verantwortet von unserem Team.
Strategie, Design und Entwicklung aus unserem Hamburger HQ. Ein Team, eine Projektleitung, Ihnen gegenüber verantwortlich von Kickoff bis Launch.
Wir begleiten Unternehmen bei ihren digitalen Produkten — und wachsen mit den Teams, mit denen wir arbeiten.
Nächste Schritte
30-minütiges Erstgespräch. Wir besprechen Ihre Ziele, klären offene Fragen und skizzieren den möglichen Projektablauf.