Le monitoring des performances des applications (APM) est essentiel pour le maintien de la fiabilité et des performances d'applications modernes distribuées basées sur des microservices et déployées dans le cloud. Mais lorsque les outils d'APM classiques sont utilisés avec des architectures modernes, vous devez souvent gérer les défis qu'ils présentent tels que les silos de données, le manque de contexte, et les angles morts qui ralentissent la résolution des incidents.
Nous lançons aujourd'hui New Relic APM 360, la prochaine étape de l'évolution de l'APM, qui fait disparaître ces limites en fournissant à vos équipes une vue unifiée de la télémétrie essentielle de tout le stack de votre application et sur tout le cycle de développement. Ainsi, vous bénéficiez de toute la puissance des informations précieuses que vous recevez quotidiennement et des workflows qu'il vous faut pour améliorer la santé et les performances de l'application. Tous les ingénieurs, quels que soient leur rôle et leur expertise, peuvent comprendre l'impact des problèmes en amont et en aval, découvrir les tendances émergentes et prévenir les problèmes avant qu'ils n'aient lieu.
Avec New Relic APM 360, toute équipe transfonctionnelle (y compris les développeurs, les opérations et la sécurité) peut :
- Prévenir les problèmes avec une vue en un clin d'œil sur la santé des applications.
- Déboguer plus rapidement grâce à la vue sur tout le stack associé au contexte de l'utilisateur et de l'activité.
- Éliminer les manques en monitoring avec des workflows guidés et des recommandations sur les données.
Une vue en un clin d'œil sur la santé de l'application pour prévenir les problèmes
New Relic APM 360 apporte, en un seul et même endroit, des informations précieuses en temps réel sur des indicateurs de santé critiques pour tout le stack et sur tout le cycle de développement de l'application en utilisant les tuiles de synthèse de l'APM. Sont comprises : les informations sur les problèmes, les déploiements, les niveaux de service et les vulnérabilités qui sont cruciales pour la santé du service global de monitoring et l'identification des problèmes émergents. Les utilisateurs ont un accès en continu à toutes les informations essentielles en un seul et même endroit sans devoir changer d'écran.
Par exemple, les tuiles de synthèse du service Gateway (dans la capture d'écran précédente) fournissent les informations suivantes :
- La tuile « Issues » indique qu'il y a une alerte critique pour le service Gateway qui requiert votre attention. En cliquant sur le problème, vous pouvez découvrir un pic du temps de transaction, qui a déclenché l'alerte.
- La tuile « Last deployment » affiche une baisse de 19 % du taux d'erreur et de 55 % du temps de réponse après le dernier déploiement. Ce qui suggère que le déploiement n'a pas eu d'impact négatif sur les performances du service Gateway.
- La tuile « Service levels » est vide, ce qui indique que les niveaux de service ne sont pas configurés pour Gateway. Le service Gateway risque de ne pas répondre aux exigences des SLA.
- La tuile « Vulnerability » met en surbrillance une forte vulnérabilité sur le service Gateway qui a besoin d'être évaluée et réduite afin d'empêcher les problèmes de sécurité.
En utilisant les informations présentées dans les tuiles de synthèse, vous pouvez prendre des décisions informées sur ce qui nécessite votre attention et agir pour assurer les performances et la sécurité optimales de l'application. Dans le service Gateway, la prise en charge de l'alerte critique et de la vulnérabilité devrait être la priorité, car elles risquent d'impacter la santé et les performances du service.
Un dépannage plus rapide avec une vue unifiée et uniformisée sur tout le stack
New Relic APM 360 fait passer le monitoring au niveau supérieur en intégrant intelligemment les informations sur l'infrastructure, l'impact des erreurs sur l'utilisateur, les modèles de log et les traces distribuées avec les signaux dorés. Cela élimine les approximations et rend le dépannage intuitif et efficace pour tous les ingénieurs, quelle que soit leur expertise. Vous pouvez désormais corréler les performances des applications avec les tendances en amont et en aval pour comprendre en temps réel comment les problèmes impactent différentes parties de l'application.
L'infrastructure intégrée dans l'APM
La nouvelle expérience de monitoring d'infrastructure dans APM 360 fait le lien entre tous vos hôtes et services, et facilite l'identification des ressources insuffisamment provisionnées impactant vos services. Cela vous aide à naviguer aisément dans votre stack et de facilement identifier et analyser l'interaction entre les hôtes et les applications qui sont exécutées sur eux.
Pour illustrer l'efficacité, prenons le scénario précédent dans lequel le service Gateway a reçu une alerte en raison d'un pic du temps de transaction. En examinant les métriques du CPU et de la mémoire du tableau sur l'infrastructure intégrée dans la synthèse de l'APM (comme illustré dans la capture d'écran qui suit), vous pouvez rapidement éliminer l'infrastructure comme cause profonde possible de ce problème de performances.
Rationalisez le dépannage avec la vue unifiée et uniformisée des traces distribuées*
Les traces distribuées jouent un rôle essentiel dans la rationalisation du dépannage. Elles offrent des informations précieuses sur le comportement et les performances des systèmes distribués complexes. En visualisant les traces distribuées à côté de la télémétrie APM, vous pouvez efficacement identifier la cause racine des problèmes impactant votre service. En quelques clics, vous pouvez naviguer jusqu'à la trace pertinente et comprendre le problème en profondeur.
Par exemple, utilisons le même scénario à partir du moment où le temps de transaction du service Gateway augmente malgré le fait qu'il n'y a pas eu de déploiements récents sur le service ni de problèmes apparents avec l'infrastructure sous-jacente.
Le composant des traces distribuées d'APM 360 accélère le dépannage. Lorsque vous examinez les informations sur la trace distribuée dans la synthèse de l'APM (comme illustré dans la capture d'écran qui suit), il devient clair que la latence et le taux d'erreur provenant du service ACME ont un impact sur le service Gateway.
En sélectionnant le service associé, vous pouvez observer que la latence du service ACME en aval est montée en flèche et impacte directement le service Gateway (voir la capture d'écran qui suit). Pour vous pencher encore plus sur les détails de la trace distribuée, sélectionnez simplement View trace.
Avec la vue unifiée et uniformisée des traces distribuées dans APM 360, vous pouvez rapidement isoler les services problématiques et accélérer la résolution.
Améliorer l'expérience utilisateur avec l'impact de l'erreur sur l'utilisateur
APM 360 va au-delà des métriques brutes sur l'erreur et fournit aussi l'analyse des impacts. Outre le taux d'erreur, APM 360 vous permet désormais de visualiser aussi l'impact des erreurs sur l'utilisateur. Ainsi, vous pouvez identifier et prioriser les erreurs qui ont l'impact le plus important sur vos utilisateurs et améliorer leur expérience générale de votre application.
Si l'on continue avec le scénario donné en exemple plus haut, vous remarquerez que le service ACME impacte les performances du service Gateway. En creusant davantage dans le service ACME (comme illustré dans la capture d'écran qui suit), vous noterez que le taux d’erreur a nettement augmenté après un déploiement. Avec l'impact des erreurs sur l'utilisateur, vous pouvez identifier que builtins:TimeoutError
a le plus gros impact sur les utilisateurs, vous devez donc le prioriser pour le dépannage.
Gagnez des infos précieuses plus rapidement avec les modèles de logs en contexte*
Dans le même ordre d'idées que l'impact des erreurs sur l'utilisateur, les modèles de log sont la façon la plus rapide de découvrir de la valeur dans les données de log sans devoir faire de recherche. Cela peut rapidement amener à des logs qui fournissent une explication à la cause profonde, mais la plupart des données sont répétitives et difficiles à contextualiser lors de la navigation. Les modèles peuvent rendre les données de log découvrables sans passer trop de temps à lire les données à faible valeur.
APM 360 comprend les modèles de log dans le graphique des logs en plus des types de logs dans la vue tout-en-un, ce qui facilite le repérage de la cause profonde des problèmes. Dans la capture d'écran qui suit, vous pouvez voir que 50 000 des logs capturés pour le service ACME ont un modèle de chaîne GET <*> HTTP 1.1
qui n'est pas associé aux erreurs qui sont les causes profondes dans le service ACME. Vous pouvez donc ignorer ces logs sans risque et vous concentrer sur d'autres logs qui sont plus pertinents pour le dépannage et la résolution des problèmes.
APM 360 offre une vue unifiée et uniformisée sur tout le stack qui permet la corrélation en temps réel des performances de l'application avec les tendances en amont et en aval. Cette visibilité complète permet aux ingénieurs, quel que soit leur niveau d'expertise, de comprendre l'impact des problèmes sur les différents composants de l'application et d'accélérer le dépannage.
Éliminez les angles morts avec des workflows guidés et des recommandations sur les données
Pour améliorer vos pratiques d'observabilité, APM 360 vous aide à gérer les manques en monitoring et à passer à un monitoring continu. Cette solution vous guide dans le processus de découverte de services non instrumentés, d'alertes manquées, de SLO et de vulnérabilités, et vous assure ainsi que rien d'important ne vous échappe et que vous pouvez identifier les problèmes qui vous étaient jusqu'alors inconnus.
Voici deux scénarios où APM 360 découvre des manques en monitoring :
- SLO manquant : cette capture d'écran met en évidence l'absence de niveaux de service pour le service Gateway.
- Carences dans l'instrumentation : APM 360 met au jour le manque d'instrumentation de l'infrastructure au sein du service Billing.
Avec ces informations précieuses, APM 360 garantit que vous avez une vue complète de tout votre monitoring, ce qui vous permet de tenir compte des lacunes et de renforcer votre framework d'observabilité.
L'empowerment des ingénieurs pour qu'ils excellent
New Relic APM 360 ne vise pas seulement le monitoring, la solution veut aussi permettre à tous les ingénieurs d'exceller dans leur utilisation des outils d'APM, quel que soit leur niveau d'expertise. En fournissant une vue holistique de la santé du service et des indicateurs d'application clés, APM 360 vous fournit les informations détaillées dont vous avez besoin pour assurer les performances et la santé de votre application, empêcher les problèmes et avoir un véritable impact sur les résultats de votre entreprise.
Étapes suivantes
Démarrer avec New Relic APM 360
Les opinions exprimées sur ce blog sont celles de l'auteur et ne reflètent pas nécessairement celles de New Relic. Toutes les solutions proposées par l'auteur sont spécifiques à l'environnement et ne font pas partie des solutions commerciales ou du support proposés par New Relic. Veuillez nous rejoindre exclusivement sur l'Explorers Hub (discuss.newrelic.com) pour toute question et assistance concernant cet article de blog. Ce blog peut contenir des liens vers du contenu de sites tiers. En fournissant de tels liens, New Relic n'adopte, ne garantit, n'approuve ou n'approuve pas les informations, vues ou produits disponibles sur ces sites.