New Relic AIOps: Schneller am Fehler, schneller an der Lösung

Mit immer komplexeren Software- und Systemstrukturen fällt auch für Engineering-Teams mehr und mehr Aufwand an: Monitoring für eine zunehmend größere Tech-Landschaft will instituiert und umgesetzt, auf häufigere Software-Änderungen reagiert werden. Hinzu kommen komplett neue Datensätze aus fragmentierten Tooling-Konstellationen und mehr Alerts. Und vor allem – zusätzlicher Druck, umgehend auf Probleme zu reagieren, die Kundenerlebnis oder SLOs beeinträchtigen könnten. Zu jeder Zeit umgeben sind Engineers dabei zudem von einem wahrhaftigen Alert-Gewitter. Aus diesem Informationsrauschen die richtigen Signale treffsicher herauszufiltern, relevante Alerts adäquat zu priorisieren und passende Response-Maßnahmen einzusteuern, wird somit immer mehr zur Herausforderung.

AIOps entschärft dieses Dilemma, gibt Bereitschaftsteams künstliche Intelligenz und maschinelles Lernen an die Hand, um Incidents schneller zu erfassen, zu diagnostizieren und zu beheben. Als direkt in New Relic One integrierte Technologie erweitert Applied Intelligence die New Relic Observability-Plattform um automatisch und einfach einsetzbare AIOps-Features und nimmt Incident Response die Komplexität.

Radar für Anomalien und Ausreißer in Systemabläufen

Durch Benachrichtigungen direkt in Ihren wichtigsten Kommunikationstools wie z. B. Slack machen Sie potenzielle Probleme aus, bevor sie sich überhaupt auf Ihre Kunden auswirken können.

  • Applied Intelligence etabliert pro-aktives Monitoring für Ihre Anwendungs-Metrics und Log-Daten, prüft dabei auf Muster und Anomalien und gibt umgehend zugehörige Alerts aus. Grundlage bilden dabei SRE-Kernsignale wie Latenz, Fehler und Auslastung.

  • Analysieren Sie Millionen an Log-Nachrichten mit nur einem Klick. Mit Clustering für Ihre Log- Daten reduzieren Sie den Aufwand für manuelle Abfragen und identifizieren auch ansonsten kaum aufzuspürende Anomalien umgehend.

  • Umfassende Detail-Analytics – etwa zum betroffenen Service und zu Up- und Downstream- Effekten – für jede Anomalie beschleunigen Ihre Fehlerbehebung.

anomaly detection example screenshot

Event-Korrelation: Ein Ende der Alert-Schwemme

Gruppieren Sie Ihre Alerts automatisch, um irrelevante Benachrichtigungen schneller herauszufiltern und Ihrer Incident Response mehr Fokus zu verleihen.

  • Applied Intelligence unterdrückt irrelevante Alert- Wiederholungen und korreliert Zusammenhänge mit identischen Kernproblemen. Statt endlosen Alert-Schwemmen prüfen Sie also nur noch eine einzige Problemstellung mit allen notwendigen Informationen.

  • Die Korrelation erfolgt automatisch anhand zeitbasiertem Clustering, Kontext aus Alert-Metadaten sowie Topologie-Informationen basierend auf den individuellen Zusammenhängen Ihrer Services.

  • Über Ihre eigene Entscheidungslogik, die Sie über eine intuitive UI einsteuern können, ist weiteres Finetuning für Ihre Korrelations-Engine problemlos machbar.

noise reduction example screenshot

Schneller zur Fehlerursache

Direkt umsetzbare Einblicke vermitteln präzise Details zu Entstehung und Hintergrund jedes Problems, den betroffenen Services und Systemen, Schwere sowie Handlungsempfehlungen.

  • Applied Intelligence kategorisiert Fehler automatisch mittels SRE-Kernsignalen, weist Deployments aus, die womöglich damit im Zusammenhang stehen, und bringt Sie damit direkt näher zur Ursache.

  • Auch das Fehlerausmaß lässt sich so anhand der betroffenen Entitäten und Software- Komponenten rasch bestimmen.

  • Weiter werden sogar Hinweise zu passenden internen Incident-Empfängern ausgegeben, damit Sie Probleme mit Präzision an Ihre Teams steuern können.

root cause analysis example screenshot

AIOps mit New Relic: Die Vorteile im Überblick

Steile Lernkurven sind bei AIOps-Konzepten quasi Standard, beanspruchen so Zeit- und Skill- Ressourcen signifikant. Schon allein hier hebt sich New Relic Applied Intelligence ab.

  • Fehlererkennung und -diagnose in Rekordzeit: Machen Sie Anomalien schon in der Entstehung aus, dies ohne jeden Konfigurationsaufwand. Automatische Out-of-the-box-Korrelationen und bereits trainierte ML-Modelle reduzieren Alert-Rauschen um bis zu 90 %. Kurzum: flachere Lernkurven, kürzere Schulungsphasen, weniger Komplexität bei der Integration.

  • Alert-Zusammenhänge quellenübergreifend korreliert: Erfassen Sie Alerts und Events aus jeder beliebigen Quelle in New Relic und darüber hinaus. Korrelieren Sie Alerts und Incident-Daten aus jedem alertgenerierenden Tool, beispielsweise Splunk, Prometheus, Grafana oder Amazon CloudWatch. So reduzieren Sie Alert-Rauschen und priorisieren die schwerwiegendsten Problemstellungen.

  • Einpassung in Ihre Incident Management Workflows: Integrieren Sie Applied Intelligence in nur wenigen Klicks direkt mit Ihren Tools für Incident Management wie PagerDuty und ServiceNow. Initiieren Sie Workflows zur Behebung von Fehlern, synchronisieren Sie Problemzusammenhänge und zentralisieren Sie Ihr Incident Management.

  • Transparenz zu Incident-Korrelationen: AIOps-Tools sollten keine Black Box sein. Mit New Relic erlangen Sie Detail-Transparenz zum Wie und Warum Ihrer Event-Korrelationen. Über Ihre eigene Entscheidungslogik drehen Sie optional an den Stellschrauben des Systems, verfeinern Ihre Ergebnisse zusätzlich.

New Relic kostenlos nutzen. Für immer.

Starten Sie jetzt mit AIOps und identifizieren Sie Anomalien schneller, reduzieren Sie Alert- Rauschen und adressieren Sie Fehlerursachen rascher – mit Ihrem kostenlosen Zugang zu Applied Intelligence.