Was kostet ein KI-Chatbot mit Unternehmenswissen?

Ein einfacher RAG-Prototyp mit einer Datenquelle kostet häufig 20.000 bis 60.000 EUR. Ein produktiver Unternehmens-Chatbot mit Rollenmodell, SSO, mehreren Integrationen, Evaluation und Monitoring liegt oft bei 60.000 bis 180.000 EUR oder mehr. Dazu kommen laufende Kosten für Modellnutzung, Embeddings, Vektordatenbank, Hosting und Betrieb. Ein einfacher Website-FAQ-Bot kann deutlich günstiger sein.

Ist ein RAG-Chatbot DSGVO-konform möglich?

Ja, wenn Datenflüsse, Rechtsgrundlage, Auftragsverarbeitung, EU-Hosting, Speicherfristen, Löschkonzept und Zugriffskontrollen sauber geplant werden. Besonders wichtig ist, personenbezogene Daten nicht unnötig in Prompts, Logs oder Embeddings zu speichern und Berechtigungen vor dem Modellkontext zu prüfen.

Was schreibt der EU AI Act für Chatbots vor?

Die Transparenzpflichten aus Artikel 50 gelten ab dem 2. August 2026: Nutzer müssen klar erkennen, dass sie mit einem KI-System interagieren. Hochrisiko-Pflichten wurden mit dem Digital Omnibus von August 2026 auf Dezember 2027 verschoben. Die meisten internen Wissens-Chatbots sind keine Hochrisiko-Systeme, brauchen aber Transparenz, Zweckbindung und Dokumentation.

Was ist permission-aware RAG?

Permission-aware RAG prüft Berechtigungen während des Retrievals, nicht erst in der Oberfläche. Bevor das Sprachmodell antwortet, filtert das Backend, welche Dokumente und Datensätze der konkrete Nutzer überhaupt sehen darf. Gelangt ein nicht autorisierter Abschnitt in den Modellkontext, ist die Zugriffskontrolle bereits gescheitert.

Wie verhindert man falsche Antworten und Prompt Injection?

Halluzinationen reduziert man durch gepflegte Quellen, Retrieval-Tests, Quellenangaben, Antwortregeln und regelmäßige Evaluation. Gegen Prompt Injection – laut OWASP das größte LLM-Risiko 2025 – helfen klare Trennung von Systemanweisung und abgerufenen Inhalten, serverseitige Tool-Grenzen und menschliche Freigabe für riskante Aktionen.

Welche Datenquellen eignen sich für den Start?

Gute erste Quellen sind aktuell, fachlich geprüft, klar verantwortet und wenig sensibel: gepflegtes Helpcenter, Produktdokumentation oder aktuelle Prozesshandbücher. Schlechte erste Quellen sind große Ablagen mit alten, widersprüchlichen oder unberechtigten Dokumenten. Für einen Pilot ist eine starke Quelle besser als zehn schwache.

Kontakt

Alle Beiträge

KI27. Mai 20267 min Lesezeit

KI-Chatbot mit Unternehmenswissen 2026: RAG, DSGVO, Kosten

„ChatGPT mit unseren eigenen Daten“ ist 2026 der häufigste KI-Wunsch im Unternehmen. Wir zeigen, was einen RAG-Chatbot von der Demo zum produktiven System macht: permission-aware Architektur, Datenquellen, EU AI Act, Sicherheit und ehrliche Kostenkorridore.

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

Aktualisiert am

29. Juni 2026

7 min Lesezeit

KI im Unternehmen ist 2026 kein Pilotthema mehr: Laut der Bitkom-KI-Studie 2026 setzen 41 Prozent der Unternehmen ab 20 Beschäftigten KI aktiv ein, weitere 48 Prozent planen oder diskutieren den Einsatz. Der häufigste Wunsch dahinter lautet „ChatGPT mit unseren eigenen Daten“. Gemeint ist meist kein allgemeiner Chatbot, sondern ein System, das interne Dokumente, Wikis, Produktinfos und Supportdaten durchsucht und daraus nachvollziehbare Antworten erzeugt. Technisch heißt der Ansatz Retrieval-Augmented Generation (RAG).

Der Abstand zwischen einer Demo und einem produktiven System ist allerdings groß. Eine Demo beantwortet Fragen aus ein paar PDFs. Ein produktiver Unternehmens-Chatbot muss wissen, welche Daten ein Nutzer sehen darf, wann er unsicher ist, wie Quellen zitiert werden und wie Qualität dauerhaft gemessen wird.

Demo oder Produktivsystem: der teure Unterschied

Sehr unterschiedliche Systeme werden alle „KI-Chatbot“ genannt – und genau hier entstehen die meisten Fehlentscheidungen. Für eine öffentliche Website-FAQ reicht oft ein Standardtool. Für Unternehmenswissen mit Berechtigungen, SSO, sensiblen Daten und mehreren Systemen braucht es eine andere Architektur. Der häufigste teure Fehler ist, mit einem einfachen Demo-Bot zu starten und ihn später unkontrolliert auf sensible Daten loszulassen.

Typ	Geeignet für	Grenzen
Website-FAQ-Bot	öffentliche Fragen, Helpcenter, einfache Lead-Qualifizierung	wenig Rechte, einfache Quellen
Interner Wissensbot	Policies, Onboarding, Prozesswissen, Produktdoku	braucht Datenpflege, Rollen, Quellenverantwortung
Support-RAG-Bot	Tickets, Produktdoku, Fehlerdatenbank, Antwortvorschläge	braucht Qualitätssicherung und menschliche Freigabe
Kundenportal-Assistent	kundenspezifische Dokumente, Status, Verträge	braucht strikte Mandantentrennung
Agentischer Workflow	Chatbot plus Aktionen in CRM, Ticketing, ERP	braucht Tool-Grenzen, Audit-Logs, Freigaben

Die ehrliche Frage vor dem Start ist nicht „welches Modell?“, sondern: Welche Datenquellen, welche Berechtigungen, welcher konkrete Frage-Antwort-Prozess? Wer das klärt, baut kein KI-Experiment, sondern ein Produkt.

Wie permission-aware RAG funktioniert

In Unternehmen ist der wichtigste Architekturpunkt nicht der Prompt, sondern die Frage, welche Daten überhaupt in den Modellkontext gelangen dürfen. RAG sucht zuerst relevante Informationen und lässt das Sprachmodell dann auf Basis dieses Kontexts antworten. Der kritische Schritt liegt zwischen Suche und Antwort: die Rechteprüfung.

RAG-Pipeline in fünf Schritten: Quellen anbinden, indexieren, Retrieval, permission-aware Rechtefilter (lime hervorgehoben) und Antwort mit Quellen. — Permission-aware RAG: Der Rechtefilter sitzt vor dem Modellkontext – nicht erst in der Oberfläche.

Ein permission-aware System prüft vor jeder Antwort, wer der Nutzer ist, zu welcher Organisation oder Rolle er gehört und welche Dokumente, Tickets oder Datensätze er sehen darf – inklusive Rechten aus SharePoint, Google Drive, CRM oder einem eigenen Backend. Diese Prüfung gehört ins Backend und muss für jede Anfrage gelten, nicht nur beim Login. Gerade bei Kundenportalen, HR-, Vertrags- oder Finanzdaten ist das der Unterschied zwischen Demo und Produktion. Gelangt ein nicht autorisierter Abschnitt einmal an das Modell, ist die Zugriffskontrolle bereits gescheitert. Wie wir solche Systeme bauen, zeigt unsere KI-Integration.

Datenquellen: womit der Pilot startet

Die Datenquellen bestimmen die Qualität stärker als das Modell. Nicht jede Quelle eignet sich für den Start. Gute erste Quellen sind aktuell, fachlich geprüft, klar verantwortet und wenig sensibel. Schlechte erste Quellen sind riesige Ordnerstrukturen mit alten, widersprüchlichen oder unberechtigten Dokumenten.

Datenquelle	Eignung für Pilot	Warum
gepflegtes Helpcenter	hoch	klare Inhalte, häufige Fragen, guter Quellenbezug
Produktdokumentation	hoch	gut strukturierbar, hoher Nutzen für Support und Sales
interne Prozesshandbücher	mittel bis hoch	hilfreich, wenn aktuell und verantwortlich gepflegt
SharePoint/Drive mit Altdateien	niedrig bis mittel	braucht Bereinigung, Metadaten, Rechteprüfung
CRM- und Ticketdaten	mittel	nützlich, aber personenbezogen und rechteabhängig
Verträge und HR-Dokumente	vorsichtig	hohe Sensibilität, klare Rollen und Freigaben nötig

Ein guter Pilot startet nicht mit „alle Daten“, sondern mit einer wertvollen, kontrollierbaren Quelle und einem klaren Fragetyp. Für den produktiven Betrieb kommen Synchronisation, Änderungsverfolgung, Duplikaterkennung und klare Datenverantwortliche dazu. Mehr dazu in KI-Use-Cases realistisch starten.

Datenschutz, EU AI Act und Sicherheit

Bei Unternehmens-Chatbots geht es fast immer um personenbezogene oder vertrauliche Daten – Governance ist deshalb Teil der Architektur, nicht ein Anhang. Technisch sollten früh klare Antworten stehen: Welche Quellen enthalten personenbezogene Daten? Welche Inhalte dürfen an Modellanbieter gehen? Wo liegen Prompts, Antworten, Logs und Embeddings, wie lange, und wer kann sie einsehen?

Der EU AI Act ist seit dem 1. August 2024 in Kraft und wird gestaffelt anwendbar. Für Chatbots zählt vor allem Artikel 50: Die Transparenzpflichten gelten ab dem 2. August 2026 – Nutzer müssen klar erkennen, dass sie mit einem KI-System sprechen. Mit dem Ende 2025 vorgeschlagenen Digital Omnibus haben sich Gesetzgeber im Mai 2026 darauf geeinigt, die Pflichten für Hochrisiko-Systeme nach Anhang III von August 2026 auf den 2. Dezember 2027 zu verschieben. Die meisten internen Wissens-Chatbots sind keine Hochrisiko-Systeme, brauchen aber Transparenz, Zweckbindung, Risikobewertung und Dokumentation.

Sicherheit ist ein eigenes Thema. Sobald ein Chatbot externe Inhalte liest oder Aktionen auslöst, kann ein Dokument oder eine Nutzerfrage versteckte Anweisungen enthalten. In den OWASP Top 10 für LLM-Anwendungen (2025) steht Prompt Injection auf Platz 1; neu bewertet werden Schwächen in Vektor- und Embedding-Systemen, die für RAG besonders relevant sind. Praktische Gegenmaßnahmen: Systemanweisung, abgerufene Inhalte und Nutzereingabe klar trennen, Tool-Aufrufe serverseitig begrenzen und validieren, keine Secrets in Prompts oder Logs, und irreversible Aktionen nur mit menschlicher Freigabe. Ein RAG-Chatbot wird sicherer, wenn er weniger darf – mehr dazu in Risiken in KI-Softwareprojekten.

Kosten und Fahrplan: Pilot vor Produktion

Ein KI-Chatbot sollte in Stufen gebaut werden – der Pilot beantwortet, ob Datenlage und Nutzen tragfähig sind, bevor in Rollen, SSO und Betrieb investiert wird. Die folgenden Korridore sind unsere typischen Projektgrößen, keine Listenpreise; die tatsächliche Zahl hängt von Quellen, Integrationen und Compliance-Tiefe ab.

Vier Kostenkorridore für KI-Chatbot-Projekte: Daten-Check 5.000 bis 15.000 Euro, RAG-Prototyp 20.000 bis 60.000 Euro, Pilot 40.000 bis 100.000 Euro und produktiver Unternehmens-Chatbot ab 60.000 Euro. — Vom Daten-Check zum Produktivsystem: typische Projektkorridore. Schätzungen hafencity.dev, Juni 2026.

Projekttyp	Realistischer Korridor	Was enthalten ist
Daten- und Use-Case-Check	5.000–15.000 EUR	Use Case, Quellen, Datenschutz, Erfolgsmetriken
RAG-Prototyp	20.000–60.000 EUR	eine Quelle, einfache Oberfläche, Quellenantworten
Pilot mit echten Nutzern	40.000–100.000 EUR	Nutzergruppe, Evaluation, erste Rechteprüfung
Produktiver Unternehmens-Chatbot	60.000–180.000 EUR und mehr	Rollen, SSO, Integrationen, Monitoring, Betrieb

Dazu kommen laufende Kosten. Sie sind oft kleiner als gedacht: Embeddings kosten bei OpenAI mit text-embedding-3-small rund 0,02 $ je Million Tokens, die laufenden Treiber sind eher Modellaufrufe pro Antwort, Vektordatenbank, Hosting, Monitoring und Daten-Synchronisation. Wichtiger als der Einstiegspreis ist, ob Antwortqualität messbar bleibt: gepflegte Quellen, Retrieval-Tests, Quellenangaben, Refusal-Verhalten bei Unsicherheit und ein Evaluationsset. Ein produktiver Chatbot sollte sagen können: „Dazu finde ich in den freigegebenen Quellen keine belastbare Antwort.“ Diese Grenze ist ein Qualitätsmerkmal, kein Fehler.

Nächste Schritte

Drei Fragen klären die Machbarkeit schneller als jede Tool-Demo:

Datenlage: Welche Quelle ist aktuell, freigegeben und klar verantwortet – und welcher Fragetyp soll zuerst beantwortet werden?
Berechtigungen: Gibt es SSO, Gruppen oder Rollen, die der Chatbot pro Nutzer übernehmen muss?
Risiko: Wie nah kommen Antworten an Entscheidungen mit rechtlicher, finanzieller oder HR-Wirkung?

Wenn diese Punkte unklar sind, ist der erste Schritt kein Chatbot-Bau, sondern ein Daten- und Rechtecheck. Wir starten je nach Reifegrad mit einer KI-Strategie oder direkt mit einem begrenzten RAG-Piloten. Schildern Sie uns Zielgruppe, Datenquellen und den kritischsten Frage-Antwort-Prozess – dann buchen Sie ein Erstgespräch.

Häufige Fragen

Schlussfolgerung

Ein Unternehmens-Chatbot wird nicht durch ein Sprachmodell produktionsreif, sondern durch Datenqualität, Berechtigungen, Evaluation, Logging und Integration in echte Workflows. RAG ist der technische Kern, aber Governance und Betrieb entscheiden, ob daraus ein verlässliches System wird.

Geschrieben von

Marius Gill

Geschäftsführer und Softwareentwickler mit über 10 Jahren Erfahrung

Alle Beiträge

Weitere Beiträge

Sicherheit

Aktualisiert 9. Juli 2026

Kostenloser Security-Check: Software sicher prüfen lassen

Wer nach einem kostenlosen Security-Check sucht, will wissen, ob die eigene Software sicher ist – ohne gleich ein teures Audit zu beauftragen. Wir erklären ehrlich, was ein kostenloser Check leisten kann, wo seine Grenzen liegen und woran Sie seriöse Angebote von getarnten Verkaufsgesprächen unterscheiden.

Business

Aktualisiert 30. Juni 2026

Build, Buy oder Agentur? Die Software-Entscheidung im Mittelstand

Standardsoftware kaufen, selbst entwickeln oder mit einer Agentur bauen? Die Entscheidung ist im Mittelstand selten binär. Wir zeigen mit aktuellen Zahlen, wann welcher Weg trägt – und warum der Partner-Weg Tempo und Kapazität liefert, ohne dass Sie das Eigentum an Ihrer Software aufgeben.

KI

Aktualisiert 30. Juni 2026

EU AI Act im Mittelstand: Auch wer KI nur nutzt, hat Pflichten

Viele Geschäftsführer glauben, der EU AI Act betreffe nur, wer KI baut. Falsch: Schon wer KI einsetzt – im Recruiting, im Service-Chatbot, beim Scoring – ist Betreiber und hat Pflichten. Wir erklären, wer betroffen ist, welche Pflichten ab wann gelten und wie Compliance-by-design aus einer Belastung ein Nicht-Ereignis macht.

Nächste Schritte

Lassen Sie uns über Ihr Projekt sprechen

30-minütiges Erstgespräch. Wir besprechen Ihre Ziele, klären offene Fragen und skizzieren den möglichen Projektablauf.

Termin buchen

Buchungskalender (Cal.com)

Dieser Bereich bindet den externen Dienst Cal.com ein. Mit dem Laden stimmen Sie zu, dass eine Verbindung zu Cal.com hergestellt und dabei Daten in die USA übertragen werden können.

Datenschutzerklärung