Application Performance Monitoring (APM) ist das A und O, wenn es darum geht, die Zuverlässigkeit und Performance moderner, Microservices-basierter Apps in einer verteilten Cloud-Umgebung zu gewährleisten. Leider treten häufig Herausforderungen wie Datensilos, mangelnder Kontext und blinde Flecken auf, die eine wirksame Incident Response verzögern, wenn herkömmliche APM-Tools im Rahmen einer modernen Architektur zum Einsatz kommen. 

Daher erfolgt heute der Launch von New Relic APM 360, der nächsten Entwicklungsstufe von APM. Damit räumen wir diese Einschränkungen ein für alle Mal aus dem Weg: Ab sofort erhalten Ihre Teams eine einheitliche Ansicht aller wesentlichen Telemetriedaten über den gesamten App-Stack und den vollständigen Dev-Lifecycle hinweg und haben damit sämtliche aktuellen Einblicke sowie die nötigen Workflows zur Hand, um die Health und Performance Ihrer Apps zu optimieren. Jetzt können erfahrene und frisch gebackene Engineers gleichermaßen und unabhängig von ihrer Rolle die Upstream- und Downstream-Auswirkungen von Problemen ausfindig machen, aufkommenden Trends auf die Spur kommen und Fehler verhindern, bevor sie auftreten.

Mit New Relic APM 360 können Entwickler:innen, Ops und Security-Spezialist:innen – d. h. alle funktionsübergreifenden Teams – ohne Weiteres:

  • Fehler dank einer kompakten Komplettansicht der Application Health verhindern; 
  • das Debugging anhand der Full-Stack-Ansicht mit informativem Benutzer- und Business-Kontext schneller abschließen;
  • Monitoring-Lücken mit geführten Workflows und Datenempfehlungen schließen.

Kompaktansicht aller App-Health-Infos hilft, Fehler zu verhindern

New Relic APM 360 bietet Einblicke in kritische Health-Indikatoren über den gesamten Stack und den App-Development-Lifecycle hinweg in Echtzeit – zentral und in Form intuitiver Übersichtskacheln. Dazu zählen Informationen zu Fehlern, Deployments, Service Levels und Schwachstellen, die für das Monitoring der Service-Health insgesamt und die frühzeitige Identifizierung dräuender Probleme unverzichtbar sind. Benutzer:innen haben damit ungebrochenen Zugriff auf alle wesentlichen Informationen an einem Ort, ohne den Bildschirm wechseln zu müssen.

Die Übersichtskacheln zum Gateway-Service (siehe Screenshot oben) zeigen z. B. Folgendes an:

  • „Issues“: Weist auf einen kritischen Alert für den Gateway-Service hin. Beim Klicken auf den Alert wird klar, dass dieser durch einen Transaktions-Spike ausgelöst wurde.
  • „Last deployment“: Zeigt an, dass seit dem letzten Deployment die Fehlerquote um 19 % und die Reaktionszeit um 55 % gesunken ist. Somit ist es äußerst unwahrscheinlich, dass das Deployment die Service-Performance beeinträchtigt hat.
  • „Service levels“: Diese Kachel zeigt keine Informationen an, d. h. es wurden keine Service Levels für Gateway eingerichtet. Somit besteht die Gefahr, dass der Service den SLAs nicht gerecht wird.
  • „Vulnerabilities“: Hier ist eine wichtige Schwachstelle im Service zu sehen, die geprüft und behoben werden muss, um Sicherheitsprobleme zu verhindern.

Anhand der Angaben in den Übersichtskacheln können Sie fundierte Entscheidungen darüber treffen, worauf geachtet werden muss und welche Maßnahmen zu ergreifen sind, um für optimale Performance und Sicherheit der App zu sogen. Im Hinblick auf den Gateway-Service sollten der Alert und die Schwachstelle Priorität haben, da sich diese am ehesten auf die Health und Performance des Service auswirken werden.

Schnellere Fehlerbehebung dank der zentralen Full-Stack-Ansicht 

New Relic APM 360 bietet Next-Level-Monitoring dank intelligenter Integration der wichtigsten Infra-Infos, der Folgen von Fehlern für Benutzer:innen, von Log-Mustern und Distributed Traces mit goldenen Signalen. Das bereitet dem Ratespiel ein Ende und macht die Fehlerbehebung für alle Engineers intuitiv und effizient – unabhängig vom Grad ihrer Erfahrung. Ab sofort können Sie die Anwendungs-Performance mit Upstream- und Downstream-Trends korrelieren, um in Echtzeit nachzuvollziehen, wie sich Fehler auf andere Bereiche der App auswirken.

In APM integrierte Infrastruktur

Mit dem neuen Infrastruktur-Monitoring in APM 360 bringen wir alle Ihre Hosts und Services unter einen Hut und machen es Ihnen einfach, unterversorgte Ressourcen zu identifizieren, die sich negativ auf die Service-Performance auswirken. So können Sie im gesamten Stack navigieren und mühelos analysieren, was zwischen Ihren Hosts und den darauf laufenden Anwendungen vor sich geht. 

Eine gute Vorstellung der Effektivität erhalten Sie, indem Sie an das zuvor geschilderte Szenario denken, bei dem ein Alert wegen eines plötzlichen Anstiegs der Transaktionszeit für den Gateway-Service ausgegeben wurde. Ein Blick auf die Metriken zu CPU und Speicher in der Tabelle zur integrierten Infrastruktur (siehe nächster Screenshot) gibt sofort Aufschluss darüber, dass die Ursache dieser Leistungsprobleme nicht in der Infrastruktur zu suchen ist.

Effiziente Fehlerbehebung durch die zentrale Ansicht von Distributed Traces*

Distributed Traces spielen eine wichtige Rolle für die effiziente Fehlerbehebung. Sie liefern wertvolle Einblicke in das Verhalten und die Performance komplexer, verteilter Systeme. Durch die Betrachtung von Distributed Traces im Kontext der zugehörigen APM Telemetrie können Sie die Ursache von Problemen, die Ihren Service beeinflussen, schnell ermitteln. Mit einigen wenigen Mausklicks können Sie den relevanten Trace öffnen und das Problem umfassend überblicken. 

Sehen wir uns zum Beispiel das vorherige Szenario an, bei dem die Transaktionszeit des Gateway-Service ansteigt, obwohl in letzter Zeit keine neuen Deployments stattgefunden haben und keine offensichtlichen Probleme mit der zugrundeliegenden Infrastruktur vorliegen. 

Die Komponente für Distributed Traces in APM 360 beschleunigt die Fehlerbehebung. Beim näheren Betrachten der Distributed Trace-Einblicke in der APM-Übersicht (im nächsten Screenshot) wird klar, dass Latenz- und Fehlerquoten aus dem ACME-Service sich auf den Gateway-Service auswirken.

Durch Auswahl des zugehörigen Service erkennen Sie, dass die Latenz des ACME Service (downstream) in die Höhe geschnellt ist, was sich direkt auf den Gateway-Service auswirkt (siehe nächster Screenshot). Um nähere Infos zum Distributed Trace zu sehen, wählen Sie einfach View trace aus.

Da APM 360 die Distributed Traces im Überblick anzeigt, können Sie problembehaftete Services rasch aufspüren und Fehler schneller beheben. 

Besseres Benutzererlebnis durch Einblicke in die Auswirkung von Fehlern auf Benutzer:innen

APM 360 bietet mehr als bloße Fehlermetriken: Hier sehen Sie nicht nur die Fehlerquote, sondern auch, welche Auswirkungen Fehler für Benutzer:innen haben. Damit lassen sich diejenigen Fehler prioritär bearbeiten, die sich am stärksten auf Benutzer:innen und das Benutzererlebnis der App auswirken.

Bleiben wir beim vorherigen Beispiel: Ihnen fällt auf, dass der ACME-Service sich negativ auf die Performance des Gateway-Service ausgewirkt hat. Bei näherer Betrachtung des ACME-Service (siehe nächster Screenshot) bemerken Sie, dass die Fehlerquote nach einem Deployment rapide angestiegen ist. Die Metrik für die Auswirkung des Fehlers auf Benutzer:innen gibt Aufschluss darüber, dass builtins:TimeoutError sich am stärksten auf Benutzer:innen auswirkt. Anhand dieser Information können Sie nun beschließen, diesen Fehler als erstes zu beheben.

Schnellere Erkenntnisse mit kontextbasierten Log-Mustern*

Genau wie die Auswirkungen von Fehlern auf Benutzer:innen können Sie mit Log-Mustern schnell Informationen zutage fördern, ohne Logs durchsuchen zu müssen.  Zwar lässt sich beim Durchsuchen schnell eine Ursache ermitteln, der Großteil der Daten wiederholt sich jedoch und lässt sich beim Durchsehen nur schwer kontextualisieren. Daher sind Muster bei der schnellen Analyse äußerst nützlich. 

APM 360 zeigt Log-Muster in der Log-Tabelle sowie den Log-Typ in der Gesamtansicht an, sodass Sie Fehlerursachen leicht auf den Grund gehen können. In diesem Screenshot sehen Sie, dass 50.000 der für den ACME-Service erfassten Logs das String-Muster GET <*> HTTP 1.1 aufweisen, das nichts mit den Fehlern im ACME-Service zu tun hat. Diese Logs können Sie daher ohne Weiteres außer Acht lassen, und sich stattdessen auf andere Logs konzentrieren, die für die Fehlerbehebung relevant sind.

In der Full-Stack-Ansicht von APM 360 wird die App-Performance in Echtzeit mit Upstream- und Downstream-Trends in Bezug gesetzt. Diese umfassende Transparenz versetzt Engineers aller Erfahrungsstufen in die Lage, nachzuvollziehen, wie sich Fehler auf verschiedene Komponenten der App auswirken, und beschleunigt die Fehlerbehebung. 

Monitoring-Lücken mit geführten Workflows und Datenempfehlungen schließen 

APM 360 hilft Ihnen beim Optimieren Ihrer Observability-Praxis. Mit unserem neuen Produkt können Sie mittels kontinuierlichem Monitoring bestehende Lücken schließen. Die Software leitet Sie dabei an, Services ohne Instrumentierung, fehlende Alerts, SLOs und Schwachstellen aufzudecken, damit nichts Wichtiges unbemerkt bleibt und Sie Fehler identifizieren können, die Ihnen zuvor entgangen wären.  

In den folgenden beiden Szenarien hilft APM 360 beim Aufdecken von Monitoring-Lücken:

  • Fehlende SLOs: Dieser Screenshot hebt das Fehlen von Service-Level Objectives im Gateway-Service hervor.
  • Instrumentierungslücken: APM 360 fördert die fehlende Infrastrukturinstrumentierung des Service „Billing“ zutage.

Anhand dieser Einblicke ist mit APM 360 gewährleistet, dass Sie einen umfassenden Überblick über Ihre Monitoring-Landschaft erhalten, um so Mängel anzugehen und Ihr Observability-Framework zu stärken.

Exzellenz für alle Engineers

Bei New Relic APM 360 geht es aber nicht nur um reines Monitoring, sondern auch darum, Engineers aller Erfahrungsstufen zu befähigen, APM-Tools effizient einzusetzen. APM 360 bietet eine Komplettübersicht über die Service-Health und wesentliche App-Indikatoren, damit Sie alle Infos zur Hand haben, um die Performance und Health Ihrer App zu gewährleisten, Fehlern vorzubeugen und die geschäftliche Leistung zu optimieren.