Weshalb IT Operations Teams unbedingt auf AIOps setzen sollten

Die Komplexität hybrider IT-Umgebungen (On-Premise/Cloud) steigt kontinuierlich und immer schneller an und stellt damit immer größere Anforderungen an Performance, Stabilität, Verfügbarkeit und Sicherheit. Die damit verbundenen Aufgaben und Herausforderungen sind für die IT, und dabei insbesondere die IT Operations Teams, mit den verfügbaren menschlichen Kapazitäten – Stichwort Fachkräftemangel – kaum mehr zu bewältigen. Genau an dieser Stelle kommt AIOps ins Spiel.

AIOps – was ist das?

AIOps steht für die KI-unterstützte Automatisierung des IT-Betriebs. Hauptziel ist es, die Performance und Verfügbarkeit von IT-Services und Anwendungen zu verbessern. Darüber hinaus geht es darum, zumindest Teilbereiche des IT-Betriebs und der damit verbundenen Prozesse zu automatisieren. Eine Schlüsselrolle kommt dabei KI-Technologien zu, mit denen es möglich wird, Probleme und drohende Ausfälle im IT-System zu erkennen, bevor sie auftreten (predictive analysis).

Bei prädiktiver KI (predictive AI) handelt es sich um eine Form des maschinellen Lernens, das fortschrittliche Algorithmen zur Analyse großer Datensätze verwendet, um verborgene Muster und Beziehungen zwischen Variablen zu erkennen. In der Datenanalyse trainiert die prädiktive KI ML-Modelle, um aus historischen Daten zu lernen und Vorhersagen über zukünftige Ereignisse, Szenarien oder Ergebnisse auf der Grundlage von Mustern aus diesen Daten zu treffen.

Durch die Analyse dieser Muster und Trends hilft die prädiktive Analyse beim Erkennen potenzieller Probleme und Ergreifen von Maßnahmen, um diese Probleme proaktiv zu vermeiden.

Werden diese predictive AI-Technologien mit einem Data Lakehouse verknüpft, sind sie in der Lage, einen noch größeren Nutzen zu liefern, nämlich präskriptive Erkenntnisse auf der Grundlage kontextueller Daten von der IT-Infrastrukturebene bis zur Ebene der digitalen Benutzererfahrung.

Bei generative KI geht es um eine Form von Künstlicher Intelligenz, die in der Lage ist, auf Basis vorhandener Informationen und Vorgaben eines Anwenders neue Inhalte zu generieren.

AIOps in der Praxis

Immer mehr Unternehmen setzen AIOps ein. So nutzt beispielsweise die BT Group (British Telecom) AIOPs-Technologien, um die Customer Experience seiner 30 Millionen Privatkunden und mehr als eine Million Geschäftskunden zu optimieren und darüber hinaus wettbewerbsfähig zu bleiben.

Das Application Monitoring der BT Group umfasst heute mehrere hundert Anwendungen, die 80 Prozent der „incident-generating applications“ repräsentieren. Dazu hat das IT-Betriebsteam 64 Szenarien entwickelt, die ein automatisches Beheben dieser Incidents ermöglichen. Darüber hinaus wurden das Monitoring und die Service Management-Plattformen direkt mit der Continuous Integration/Continuous Development-Plattform verknüpft. Die Entwicklungsabteilung wird so direkt informiert, wenn Probleme beim Betrieb auftreten.

Ergebnis: Dank AIOps konnte die BT Group die Mean Time to Remediation (MTTR) von knapp zwei Stunden auf 85 Sekunden verringern.

 

Dynatrace Davis AI und Davis CoPilot: Hypermodale KI für höhere Produktivität und schnellere Fehlerbehebung

Mit Davis AI bietet Dynatrace eine Kombination aus prädiktiver, kausaler und generativer KI. 

Die kausale KI analysiert Observability- und Security-Daten im Kontext von Topologie-Informationen. Sie fasst Anomalien zu Gruppen zusammen, ermittelt deren Ursachen und vergibt automatisch Prioritäten: ad hoc oder in Bezug auf die Auswirkungen auf das Unternehmen. Dynatrace setzt bereits seit mehr als einem Jahrzehnt kausale KI-Funktionen in seinen Monitoring-Lösungen ein.

Die prädiktive KI liefert kontinuierliche Prognosen und Anomalie-Vorhersagen über mehrdimensionale Grunddaten, Anwendungsverkehr und Serviceauslastung. 

Auf der Grundlage dieser Ergebnisse erstellt der Davis CoPilot dann die entsprechenden generative AI-basierten Abfragen, Notebooks und Dashboards zur Vereinfachung von Analysen. Er gibt darüber hinaus Empfehlungen für die Verbesserung von Arbeitsabläufen bzw. deren Automatisierung. 

So erkennt Davis AI beispielsweise automatisch Probleme, die sich auf die Customer Experience auswirken können und verwendet dann Topologie-, Transaktions- und Code Level-Informationen zur Ursachenanalyse. Davis CoPilot schlägt auf Grundlage dieser Analyse selbstständig Maßnahmen vor, um das Problem zu beseitigen.

Auf der Grundlage dieser Vorschläge bietet Davis AI mit der AutomationEngine dem IT-Operations Team dann die Möglichkeit, mit einem interaktiven No Code/Low Code Editor Workflows zu erstellen, die dann auf Basis eines Zeitplans oder bestimmter Ereignisse ausgeführt werden.

Der komplette Prozess von der Fehlererkennung über die Ursachenanalyse bis zum Beheben des Fehlers wird damit automatisiert.

 

Falls Sie an weiteren Informationen zum Thema AIOps im allgemeinen bzw. Dynatrace Davis AI interessiert sind, wenden Sie sich bitte an Ihren Ansprechpartner bei amasol.