← Alle Beiträge
22.04.2026 · 7 min

Was ein KI-Operator-Vertrag wirklich kosten muss

Die meisten KI-Betriebsverträge sind zu billig kalkuliert — und scheitern nach drei Monaten. Eine ehrliche Aufstellung, was laufender KI-Betrieb wirklich kostet.

Was ein KI-Operator-Vertrag wirklich kosten muss

Die Implementierung ist nicht das Problem. Das Problem beginnt am Tag nach dem Go-Live.

In der Beratung sehe ich immer wieder dasselbe Muster: Eine Agentur baut für 15.000 oder 25.000 Euro einen KI-Assistenten — Voicebot, Chatbot, Workflow-Automatisierung — und bietet danach einen Wartungsvertrag an. 300 Euro im Monat, manchmal 500. Der Kunde unterschreibt, weil es günstig wirkt. Drei Monate später funktioniert die Hälfte nicht mehr richtig, niemand fühlt sich zuständig, und die Agentur verliert Geld bei jedem Support-Ticket.

Das ist kein Einzelfall. Das ist die Regel. Und die Ursache liegt in einer ehrlichen Kalkulation, die im Vertrieb keiner machen will.

Dieser Artikel ist der Versuch, diese Kalkulation offen hinzulegen. Nicht als Preisliste — jeder Fall ist anders — sondern als Struktur, mit der Sie als KMU einen realistischen Operator-Vertrag bewerten können. Und als Anbieter einen, den Sie tatsächlich erfüllen können, ohne nach einem Quartal in den Notbetrieb zu wechseln.

Warum Pauschal-Wartung bei KI-Systemen nicht funktioniert

Bei klassischer Software ist Wartung kalkulierbar: Updates, Bugfixes, Hosting, ein bisschen Support. Die Kostenstruktur ist weitgehend fix. Bei einem KI-System haben Sie zusätzlich drei Variablen, die in einem Pauschal-Wartungsvertrag nicht abbildbar sind:

  1. Token- und API-Kosten schwanken mit der Nutzung — und zwar nicht linear, weil Kontextfenster, Tool-Aufrufe und Retry-Logik die Kosten pro Interaktion treiben.
  2. Modelle ändern sich. GPT-4o ist nicht mehr GPT-4o von vor sechs Monaten. Anthropic deprecated Modelle nach 12 bis 18 Monaten. Was heute funktioniert, muss morgen neu evaluiert werden.
  3. Halluzinationen und Drift treten unvorhersehbar auf — durch geänderte Daten, geänderte Anfragen, geänderte Modelle. Sie brauchen laufendes Monitoring, nicht nur Reaktion auf Tickets.

Wer das in eine 300-Euro-Pauschale packt, kalkuliert sich selbst in den Ruin oder den Kunden in die Frustration. Meistens beides.

Die fünf Kostenblöcke eines ehrlichen Operator-Vertrags

Lassen Sie mich die Blöcke einzeln durchgehen, wie sie in einem sauberen Angebot aufgeschlüsselt gehören. Die Zahlen orientieren sich an typischen KMU-Setups in Österreich, mit Betrieben zwischen 10 und 150 Mitarbeitern.

Block 1: Infrastruktur und API-Kosten

Das ist der Block, den die meisten Kunden unterschätzen, weil er nicht in der Implementierungsrechnung steht.

Ein Voicebot mit OpenAI Realtime API kostet aktuell rund 0,06 Euro pro Minute Audio-Input plus 0,24 Euro pro Minute Output. Typisches Beispiel: ein mittelgroßer Handwerksbetrieb mit 80 eingehenden Anrufen pro Tag, durchschnittlich 2 Minuten Gesprächsdauer — das sind rund 800 Euro im Monat, nur an OpenAI.

Dazu kommen:

  • Telefonie (Twilio, Sipgate): 30 bis 150 Euro je nach Volumen
  • Hosting der Orchestrierungs-Schicht (n8n, FastAPI, Cloud Run o. ä.): 50 bis 200 Euro
  • Vector-Database, falls RAG im Spiel ist: 30 bis 100 Euro
  • Logging und Monitoring (Langfuse, Helicone): 50 bis 150 Euro

Für einen mittleren KMU-Use-Case landen Sie schnell bei 1.000 bis 1.500 Euro reine Infrastrukturkosten im Monat. Das ist kein Margenposten, das ist Durchlaufware. Im Vertrag muss das transparent ausgewiesen sein — entweder als Pass-Through oder mit klarer Volumen-Staffel.

Block 2: Monitoring und Qualitätssicherung

Der Block, den niemand ernst nimmt, bis es kracht.

KI-Systeme produzieren keine klassischen Fehler. Sie produzieren Antworten, die plausibel klingen, aber falsch sind. Das fällt nur auf, wenn jemand systematisch hinschaut. "Hinschauen" heißt:

  • tägliche automatisierte Qualitätschecks gegen ein Referenz-Set von 50 bis 200 Beispiel-Interaktionen
  • wöchentliche manuelle Stichproben durch einen Menschen, der die Domäne versteht
  • Alerting auf Drift-Indikatoren (Antwortlängen, Tool-Call-Häufigkeit, Eskalationsrate)

Der Aufwand dafür ist nicht trivial. Realistisch sind 4 bis 8 Stunden Beraterzeit pro Woche bei einem mittleren Setup. Bei 140 Euro Stundensatz sind das 2.200 bis 4.500 Euro im Monat.

In der Praxis lässt sich das reduzieren, indem man Tooling automatisiert (Langfuse-Auswertungen, automatische Eval-Sets), aber unter 1.500 Euro im Monat kommt seriöses Monitoring nicht weg, wenn das System geschäftskritisch ist.

Block 3: Modell-Updates und Re-Evaluation

Das ist der Block, den die meisten Verträge komplett ignorieren.

Wenn OpenAI im April ein neues Modell launcht und das alte im Oktober deprecated, müssen Sie migrieren. Das ist keine Wartung, das ist eine kleine Re-Implementierung. Prompts müssen angepasst werden, weil die neuen Modelle anders auf System-Prompts reagieren. Eval-Sets müssen neu gefahren werden. Edge Cases müssen geprüft werden.

Häufiges Muster bei einem Wechsel von GPT-4-Turbo auf GPT-4o, etwa bei einem Versicherungsmakler-Setup: geplante 2 Tage Aufwand, real 6 Tage, weil die Tool-Call-Semantik bei Mehrfach-Tools anders ist. 6 Tage à 1.100 Euro sind 6.600 Euro. Wenn das einmal pro Jahr passiert, sind das 550 Euro im Monat, die im Vertrag eingepreist sein müssen.

Mein Vorschlag in Angeboten: ein fester Innovations-Topf von 8 bis 16 Stunden pro Quartal, der entweder für Modell-Migrationen oder für kleinere Erweiterungen verwendet wird. Verfällt nicht, ist aber gedeckelt.

Block 4: Reaktiver Support

Das ist der Block, den jeder Vertrag hat — und der trotzdem meistens falsch kalkuliert ist.

Die Frage ist nicht: Wie viele Tickets werden kommen? Die Frage ist: Welche Reaktionszeit ist zugesagt, und welche Tickets werden tatsächlich relevant sein?

Bei einem Voicebot mit 80 Anrufen pro Tag werden Sie pro Woche 2 bis 5 Beschwerden oder Auffälligkeiten bekommen. Davon sind etwa zwei Drittel Bedienfehler oder Erwartungs-Mismatch ("der Bot hat mich nicht verstanden") und ein Drittel echte Fehler im System. Die echten Fehler brauchen 1 bis 4 Stunden Aufwand pro Vorfall, weil Sie ins Logging müssen, den Fall reproduzieren, fixen, deployen, testen.

Realistisch: 8 bis 20 Stunden reaktiver Support pro Monat bei einem mittleren System. Das sind 1.100 bis 2.800 Euro.

Wichtig: Der Vertrag muss klar regeln, was darüber hinaus geht. Major-Incidents — System komplett unten — brauchen separate Eskalationsregeln und idealerweise eine Bereitschaft. Wer 24/7 verspricht, muss mindestens eine Person on-call haben, das kostet noch einmal extra.

Block 5: Strategische Begleitung

Der Block, der oft fehlt, aber den Unterschied zwischen "läuft" und "liefert Wert" macht.

KI-Systeme verändern Geschäftsprozesse, und die Geschäftsprozesse verändern sich auch ohne KI. Ein Operator-Vertrag, der nur die Technik betreut, verpasst die Frage: Macht das System noch das, was es soll? Kommen neue Use-Cases dazu, die mit derselben Infrastruktur abgedeckt werden könnten?

In meinen Verträgen ist ein monatliches Review-Meeting (90 Minuten) Pflichtbestandteil. Dort werden KPIs, Auffälligkeiten und Erweiterungswünsche besprochen. Das kostet inklusive Vorbereitung 4 Stunden, also rund 550 Euro im Monat. Spart aber regelmäßig deutlich mehr, weil Themen früh adressiert werden, bevor sie eskalieren.

Was kostet das in Summe für einen typischen KMU-Use-Case?

Nehmen wir den oben skizzierten Voicebot-Fall: 80 Anrufe pro Tag, OpenAI Realtime, Twilio, Anbindung an ein CRM, ein RAG-System mit Firmen-FAQ.

  • Block 1 (Infrastruktur): 1.200 Euro Pass-Through
  • Block 2 (Monitoring): 1.800 Euro
  • Block 3 (Modell-Updates, anteilig): 550 Euro
  • Block 4 (Reaktiver Support): 1.500 Euro
  • Block 5 (Strategische Begleitung): 550 Euro

Summe: rund 5.600 Euro pro Monat.

Das ist ein Faktor 10 bis 15 über dem, was die meisten KMU initial im Kopf haben, wenn sie an "Wartung" denken. Es ist aber das, was ein professionell betriebener KI-Service realistisch kostet.

Die Alternative ist nicht "günstiger" — die Alternative ist "funktioniert nach sechs Monaten nicht mehr richtig". Ich kenne genug Übernahme-Szenarien, in denen Systeme repariert werden müssen, die unter unrealistischen Wartungsverträgen verkommen sind. Die Sanierung kostet immer mehr, als der Aufpreis für ordentlichen Betrieb gekostet hätte.

Was ein KMU vor der Unterschrift prüfen sollte

Fünf konkrete Fragen, die ich jedem Geschäftsführer empfehle, bevor er einen Operator-Vertrag unterschreibt:

  1. Sind API- und Infrastrukturkosten transparent? Pass-Through mit Belegen oder feste Staffel mit klaren Volumen-Grenzen. Alles andere ist eine Wette zulasten einer der beiden Seiten.
  2. Gibt es ein definiertes Monitoring? Nicht "wir schauen drauf", sondern: Wie viele Stichproben pro Woche, welche Eval-Sets, welches Reporting?
  3. Wer trägt das Risiko bei Modell-Deprecations? Wenn OpenAI ein Modell abschaltet, ist das kein Bug. Das muss vertraglich geregelt sein — entweder im Innovations-Topf oder als separat zu beauftragender Aufwand.
  4. Welche Reaktionszeiten sind zugesagt, und was kostet ein Major-Incident? "Best effort" ist kein SLA. Stunden, Eskalationspfade, Bereitschaft — das gehört konkret in den Vertrag.
  5. Wie sieht die Exit-Strategie aus? Code-Übergabe, Prompt-Dokumentation, Eval-Sets, Logging-Zugänge. Wer das nicht regelt, bindet sich auf unbestimmte Zeit.

Die unbequeme Wahrheit für Anbieter

Wenn Sie als Agentur oder Berater Operator-Verträge anbieten und unter 3.000 Euro pro Monat für ein nicht-triviales System kalkulieren, dann subventionieren Sie entweder den Kunden aus der Implementierungsmarge oder Sie liefern keine ordentliche Leistung. Beides ist auf Dauer nicht tragfähig.

Die ehrliche Variante ist, das offen zu sagen — auch im Sales-Gespräch. Mein Eindruck: KMU-Geschäftsführer sind nicht naiv. Wenn man ihnen die Kostenstruktur sauber aufschlüsselt, verstehen sie, dass ein Echtzeit-System mit 80 Anrufen pro Tag mehr kostet als ein Standard-IT-Wartungsvertrag. Was sie nicht akzeptieren, ist die böse Überraschung nach drei Monaten.

Der beste Operator-Vertrag ist der, bei dem nach einem Jahr beide Seiten sagen: Das war fair, und das System läuft besser als am Tag der Übergabe. Alles andere ist auf eine der beiden Seiten ein Verlustgeschäft.

Newsletter

Ein Newsletter, unbegrenztes Wissen.

Jede Woche die aktuellsten News zum Thema künstliche Intelligenz für den Einsatz in Ihrem Unternehmen.