New Relic I/O, Ihr Hub für Instant Observability Jetzt Quickstart für Ihren Stack finden

Next-Gen AIOps: Probleme rascher identifizieren, analysieren und beheben als je zuvor

7 Minuten Lesedauer

Von Guy Fighel, 17. März 2021

Wo ein Hype, da ein Ergebnis? Nein, ein Automatismus dieser Couleur existiert natürlich mitnichten. Auch an AIOps lässt sich dies klar ablesen, haben doch auch hier viele DevOps- und SRE-Teams sein Potenzial nicht vollständig ausschöpfen können. Im Weg standen dabei traditionell steile Lernkurven, lange Implementierungs- und Schulungsphasen, hohe Preisbarrieren und auch eine gewisse Skepsis im Hinblick auf künstliche Intelligenz (KI) und maschinelles Lernen (ML). Für On-Call-Engineers werden dabei vor allem drei Dinge zum Hindernis für absolute Service-Stabilität:

  1. Fehler und dringlich zu analysierende Konstellationen rein anhand von Alerts oder statischen Dashboards zu identifizieren und zu klären – eine Herkulesaufgabe.
  2. Ebenso komplex ist es, Incidents zu priorisieren und zu adressieren, wenn sich ein Ausfall wie ein Lauffeuer über Tools hinweg in Form eines wahren Alert-Hagels abzeichnet.
  3. Besonders aufwändig wird es vor allem auch dann, wenn Fehlerursachen durch endlose Dashboard-Prüfsequenzen ausgemacht werden müssen.

Zeit- und kostenintensive War Rooms und theoretische Spekulationen sind also schlicht nicht mehr haltbar. Schließlich münden sie nur allzu leicht in der misslichen Lage, dass die zugrunde liegenden Probleme das Kundenerlebnis beeinträchtigen. Genau dem baut New Relic mit Applied Intelligence und der nächsten Generation von AIOps vor.

  • Sofortige Klarheit bei ungewöhnlichen Änderungen: Anomalien bei Ihren Anwendungen, Services und Logs erkennen Sie umgehend, verhindern potenzielle Probleme, bevor sie sich für Ihre Kunden bemerkbar machen.
  • Weniger Alert-Rauschen: Gruppieren Sie Alerts und Events aus jeder beliebigen Quelle und fassen Sie sie in einem konsistent korrelierten Problemszenario zusammen, das Sie direkt adressieren können. Unter dem Strich sorgen Sie so für relevantere Alerts und priorisieren Probleme insgesamt einfacher.
  • Schneller zur Fehlerursache: Automatisch generierte Detail-Insights zu wahrscheinlichen Fehlerursachen sorgen für informierte, raschere Problembehebung.
  • Direkter am Incident: Integrieren Sie New Relic Applied Intelligence mit ITSM-Lösungen für konsequente Synchronisierung und eliminieren Sie mühsame Admin-Anstrengungen rund um Incidents über mehrere Tools hinweg.

Im Folgenden werfen wir einen Detailblick auf die Features von Applied Intelligence.

Anomalien sofort identifizieren

Durchgängige, automatische Anomalie-Erkennung ohne Zusatzkosten

anomaly detection example screenshot

Applied Intelligence macht Anomalien umgehend aus, dies basierend auf SRE-Kernsignalen wie Throughput, Fehlern und Latenz über alle Anwendungen und Services hinweg. Die Technologie ist nun automatisch in New Relic One für alle instrumentierten Anwendungen und Services aktiviert – ohne Konfigurationsaufwand, ohne Zusatzkosten. Wird eine Anomalie erkannt, erhalten Sie sofort eine entsprechende Benachrichtigung über Ihre bevorzugte Kommunikationsplattform wie z. B. Slack. Hierzu gehört auch ein Echtzeit-Feed zu jeder Anomalie und Detail-Analytics für eine schnellere Fehlerbehebung und Problemprävention für Ihr Kundenerlebnis.

Video

 

Log Patterns

log patterns beta overview

Mit diesem neuen Feature in Applied Intelligence nutzen Sie maschinelles Lernen, um Muster und Ausreißer in Ihren Log-Daten zu identifizieren, wodurch Sie weitere wertvolle Troubleshooting-Zeit einsparen. Analysieren Sie Millionen an Log-Nachrichten mit nur einem Klick. Mit Clustering für Ihre Log-Daten reduzieren Sie den Aufwand für manuelle Abfragen und identifizieren auch ansonsten kaum aufzuspürende Anomalien umgehend. Log Patterns ist aktuell als Public-Beta-Version verfügbar. Um das Feature für Ihr Konto zu aktivieren, wenden Sie sich bitte an Ihren Customer Success Manager.

 

Alerts Analytics

alert analytics

Auf einer neuen integrierten Landing Page sehen Sie Insights und Analytics zu Ihren Alert-Konfigurationen ein.

 

Schedules zur Alert-Unterdrückung

alerts recurring muting rules

Definieren Sie konkrete Zeitpläne zur Unterdrückung von New Relic Alerts für geplante Wartungsarbeiten und andere planbare Downtime-Fenster. Über die New Relic UI oder API lassen sich hier tägliche, wöchentliche wie auch monatliche Schedules einrichten.

Ein Ende der Alert-Schwemme

Video

 

Relationale Korrelation

relationship based correlation

Korrelieren Sie Alert- und Event-Zusammenhänge basierend auf externen relationalen Daten aus CMDBs und New Relic Entitäten. Neben Korrelationsmöglichkeiten über zeitbasiertes Clustering und Kontext aus Alert-Nachrichten ist es nun zudem auch möglich, Topologie-Informationen aus Ihren relationalen Datastores (CMDBs) zu erfassen. So werden die Zusammenhänge zwischen Alerts aus verbundenen Services um ein Vielfaches klarer. Letztlich erhalten Sie damit auch schlüssigere Kontextdetails für Incidents und ihre Auswirkung auf Ihre Gesamtumgebung, können Probleme präziser und effektiver priorisieren.

Anomalien in Problemkorrelationen

alert noise reduction

Pro-aktiv erfasste Anomalien können ferner mit Alerts und Events aus jeder Quelle korreliert werden, um ein umfassenderes Problembild zu generieren und mehr Handlungsschnelligkeit zu gewinnen.

Raschere Korrelationsentscheidungen dank Assistance-Feature

correlation assistant

Verpasste Korrelationen? Wunschkorrelation, aber Startpunkt unklar? Mit dem neuen Assistance-Feature für Korrelationen wählen Sie einfach Incidents aus, die korreliert werden sollen. New Relic analysiert sie dann und zeigt Ihnen ihre Ähnlichkeiten auf. Die Kontrolle über Ihre Alerts liegt somit ganz bei Ihnen.

Applied Intelligence ist auch adaptiv insofern, als dass es Ihre Konfiguration simulieren kann. Sie sehen so in Echtzeit, wie Incident-Korrelationen Alert-Rauschen reduzieren und Kontext anreichern.

Kürzere Distanz zur Fehlerursache

Visibility für jedes Problem

root cause analysis example screenshot

Über Applied Intelligence erhalten Sie automatische Insights zur potenziellen Ursache von Fehlern: Warum ist ein Problem aufgetreten? Welche Deployments stehen damit im Zusammenhang? Hierbei erhalten Sie auch relevante Fehler-Logs und -Attribute und können die Thematik so schneller analysieren als jemals zuvor. Applied Intelligence prüft dabei die Verteilung jedes Attributs innerhalb der erfassten Event-Daten und bietet mögliche Ursachen durch Ableitung von auffälligen Änderungen an. Für jeden Transaktions-Event können Sie beispielsweise Checks dahingehend durchführen, ob ein einzelner Benutzer für eine ungewöhnliche Menge an Anfragen an Ihre Anwendung verantwortlich ist.

Fehlerursachenanalysen kategorisieren darüber hinaus Ihre Problemstellungen in goldene Signale wie Fehler, Traffic, Latenz und Sättigung und sorgen für rasche Orientierung.

Video

 

Klarheit zu Auswirkung und Relevanz jedes Problems

Sie erhalten Details zu den beeinträchtigen Entitäten (Hosts, Container, Anwendungen) und können so schnell und genau evaluieren, welche Schritte zu unternehmen sind. Isolieren Sie die Ursache mit automatischen Einblicken darin, welchen Einfluss ein Problem auf Ihre Services und Komponenten nimmt.

Incidents schneller beheben

Zweiwege-Integration mit ServiceNow für korrelierte Fehler

servicenow integration

Ganz im Stile unserer bestehenden Zweiwege-Integration mit PagerDuty existiert dieses Feature-Kontinuum nun auch für ServiceNow. Für unsere Nutzer bedeutet dies ganz klar: Zentralisierung von Incident-Admin statt Wechselspiel zwischen zwei Lösungen. Ändert sich der Status eines korrelierten Problems in einer der beiden Plattformen, wird dies automatisch in der anderen Lösung gespiegelt. Applied Intelligence unterstützt hier auch einen Webhook zur Integration mit VictorOps, OpsGenie und anderen beliebten Tools.

Incidents schneller an der richtigen Stelle

suggested responders

Über automatische Empfehlungen gelangen Incidents leichter zu den Mitarbeitern mit der besten Kompetenz zur Fehlerbehebung, etwa weil sie über spezifische Expertise zu einer ausgefallenen Komponente verfügen oder ähnliche Probleme bereits in der Vergangenheit erfolgreich behoben haben. Diese Erweiterung basiert auf bestehenden Feature Sets, die auf PagerDuty Daten zurückgreifen. Weder Modelltraining noch Konfiguration sind dabei vonnöten, New Relic lernt out of the box und optimiert die Mechanik zudem fortlaufend anhand neuer Daten.

Bereit?

Alle Nutzer von New Relic Applied Intelligence erhalten Zugriff auf die neuen Funktionen – ganz ohne Zusatzkosten.

Sie möchten AIOps-Features zu Ihrer New Relic Implementierung hinzufügen? Die Option „Alerts & AI“ in Ihrem New Relic Konto ist Ihr Startpunkt.

Und falls Sie noch kein bestehender New Relic Nutzer sind, sich aber für einige der hier beschriebenen Möglichkeiten interessieren, können Sie New Relic One direkt über ein dauerhaft kostenfreies Konto kennenlernen – natürlich auch mit New Relic Applied Intelligence.