KI als intelligenter Assistent für die 24/7-Incident-Resolution – ein Erfahrungsbericht
Dies ist ein Erfahrungsbericht darüber, wie ein Team von DevOps-Ingenieuren, das für den Betrieb eines kritischen Kundensystems rund um die Uhr verantwortlich ist, künstliche Intelligenz (KI) als intelligenten Assistenten nutzt. Das DevOps-Team betreut auf mehreren Ebenen ein zeitkritisches System in der Produktionslogistik eines großen deutschen Automobilherstellers. Angesichts der Komplexität und Kritikalität des Systems hat das Team eine umfassende Bibliothek mit Anleitungen erstellt, die spezifische Incident-Fälle und deren Lösungen dokumentieren.
Der Zugriff auf und die Befolgung der entsprechenden Richtlinien fordert vom diensthabenden Personal jedoch eine sorgfältige Analyse, Erfahrung und ein hohes Maß an Konzentration. Um diese Herausforderung zu bewältigen, haben wir einen KI-basierten Assistenten entwickelt, der ein großes Sprachmodell (LLM – Large Language Model) verwendet, das die Incident-Beschreibung als Eingabe nimmt und den DevOps Engineer durch die notwendigen Schritte zur Behebung des Incidents führt.
Der KI-Assistent erfüllt folgende Funktionen:
- Vorschlagen des geeigneten Incident-Resolution-Prozesses durch Abgleich der Fehlerbeschreibung mit der Anleitungsbibliothek.
- Parametrisierung der für den Incident-Fall spezifischen Datenbank- oder Log-Abfragen.
- Generierung von Zwischenschritten, die zu Dokumentationszwecken erforderlich sind.
Im Rahmen des Vortrags stellen wir den Systemaufbau, die eingesetzten KI-basierten Dienste und die Herausforderungen bei der Bereitstellung von Kontextinformationen für das große Sprachmodell vor. Zusätzlich werden wir unsere Erkenntnisse und Lösungen bezüglich der Auswahl geeigneter Prompts für das LLM diskutieren.
Die im Erfahrungsbericht geteilten Einblicke beleuchten die praktische Implementierung von KI als intelligenten Assistenten für die 24/7-Incident-Resolution. Durch den Einsatz von KI-Technologien können Organisationen ihre Incident-Resolution-Prozesse verbessern, die Effizienz steigern und die Abhängigkeit von menschlichem Fachwissen reduzieren.