SLA für KI – messbar statt vage versprochen

x25lab.com – KI-Governance: robust aufsetzen · 24.04.2026

Verbindlicher Transparenzhinweis zur Erstellung dieses Beitrags

KI-generiert/bearbeitet · unter Einbezug eigener Quellen (RAG) · nicht unabhängig verifiziert

Dieser Beitrag wurde ganz oder teilweise mit generativer KI erstellt oder bearbeitet. Dabei wurden im Rahmen eines Retrieval-Augmented-Generation-Verfahrens (RAG) eigene bzw. intern verfügbare Quellen, Dokumente und Datenbestände einbezogen. Eine unabhängige externe Verifizierung oder eine vollständige manuelle Prüfung sämtlicher Tatsachenbehauptungen, Zahlen, Zitate, Quellenverweise, Rechtsstände und Schlussfolgerungen hat vor Veröffentlichung nicht stattgefunden. Trotz Einbezug eigener Quellen wird keine Zusicherung für Vollständigkeit, Aktualität, Richtigkeit oder Eignung im Einzelfall übernommen. Der Beitrag dient ausschliesslich allgemeinen Informationszwecken. Massgeblich bleiben die jeweiligen Originalquellen sowie die fachliche Prüfung im Einzelfall.

Kernaussage: Ein Service-Level-Agreement für KI ohne klare Messgrössen ist nur ein Marketingversprechen, das Ihr Projekt schleichend entgleisen lässt. Kennen Sie das? In meiner Beratung erlebe ich mehrmals pro Jahr Unternehmen, die stolz ein «verfügbares», «verlässliches» oder «faires» KI-System liefern wollen, aber nicht wissen, wie sie diese Begriffe operationalisieren. Was macht das mit Ihrem Team, wenn Erwartungen und Realität auseinanderdriften

Was bedeutet messbar in SLA/SLO für KI

Wenn Sie von Messbarkeit sprechen, geht es nicht nur um Prozentzahlen zur Systemverfügbarkeit. Messbar heisst, dass jede Verpflichtung eine klare Metrik, eine Messmethode und eine Verantwortlichkeit hat. In meiner Erfahrung reicht «90% Genauigkeit» allein nicht, weil Unausgewogenheit der Daten oder unterschiedliche Klassen ganz andere Erfahrungen erzeugen. Fragen Sie sich: Welche Kennzahl spiegelt den Kundennutzen? Welche Metrik weist Bias, Drift oder Latenz nach? Und wer übernimmt das Monitoring, das Reporting und die Eskalation, wenn ein SLO verletzt wird

Typische Fehler aus der Praxis

Ein häufiger Fehler ist, SLA-Phrasen von der Marketingabteilung zu übernehmen, ohne oder mit vagen Definitionen der Messmethode. Ich sehe das oft bei Pilotprojekten, die in den Betrieb skaliert werden sollen. Ein zweiter Fehler ist, Metriken zu wählen, die technisch leicht zu messen sind, aber inhaltlich nichts über Nutzererfolg aussagen, zum Beispiel nur CPU-Auslastung oder Uptime statt Fehlerverteilung und Qualität der Vorhersagen. Ein dritter häufiger Fehler ist, keinen Toleranzraum oder kein Eskalations-Szenario zu definieren, sodass das Team bei ersten Abweichungen in Panik gerät

Wie Sie sinnvolle SLOs formulieren

Beginnen Sie mit der Nutzererfahrung als Referenzpunkt. Was muss das System leisten, damit ein Kunde seine Aufgabe erfolgreich abschliesst? Formulieren Sie daraus eine Metrik, etwa Fehlerrate für kritische Entscheidungen, Median-Antwortzeit für interaktive Nutzung oder Drift-Rate über definierte Zeitfenster. Legen Sie Messmethoden fest: welche Datenquelle, welches Sampling, welche Statistik. Bestimmen Sie die Häufigkeit der Messung, die Reporting-Intervalle und die Verantwortlichen. In meiner Arbeit hilft es, SLOs so zu schreiben, dass ein Dritter mit Zugang zu den Messdaten sofort nachvollziehen kann, ob das SLO eingehalten ist

Betrieb, Monitoring und Eskalation

Ein SLO ist nur so gut wie das Monitoring dahinter. Fragen Sie, wie Alarme ausgelöst werden sollen und was bei wiederholten Überschreitungen passiert. In der Praxis vermisse ich oft klare Rollen: wem gehört das Modell, wer ist für Datenqualität zuständig, wer trifft die Entscheidung für ein Retraining oder Rollback. Entscheiden Sie auch, wie Sie False-Positive- und False-Negative-Situationen handhaben. In meiner Erfahrung beruhigt ein klarer Entscheidungsbaum das Team und verhindert, dass bei ersten Problemen ad hoc und unkoordinierte Massnahmen ergriffen werden

Vertragsgestaltung und Kundenkommunikation

Wenn Ihr SLA Teil eines Vertrags wird, dann formulieren Sie Verpflichtungen so, dass sie prüfbar und auditierbar sind. Vermeiden Sie schwammige Begriffe wie «angemessene Genauigkeit» ohne Referenz. Kommunizieren Sie gegenüber Kunden transparent, welche Metriken gemessen werden, mit welcher Methodik und welche Reporting-Zyklen gelten. Was ich oft sehe: Kunden wollen Garantien, und Anbieter bieten Messbarkeit an, aber beide Seiten haben unterschiedliche Erwartungen an Fehlertoleranz und Eskalation. Klären Sie diese Erwartungen frühzeitig

Konkrete 14–30-Tage-Handlungsempfehlung für Ihr Team: Setzen Sie sich diese Woche mit den Stakeholdern zusammen und identifizieren Sie eine Kernfunktion des KI-Systems, deren Erfolg aus Nutzersicht kritisch ist, und formulieren Sie dafür ein SLO mit konkreter Metrik, Messmethode, Messintervall und Verantwortlicher; validieren Sie die Messung in der zweiten Woche anhand realer Produktionsdaten, passen Sie die Sampling- und Reporting-Parameter an, vereinbaren Sie ein einfaches Eskalationsverfahren für SLO-Verletzungen und planen Sie einen kurzen Review-Termin nach 30 Tagen, um die SLOs anhand gemessener Ergebnisse zu justieren und zu entscheiden, ob weitere SLOs oder Anpassungen nötig sind