Les équipes d'ingénierie ont la responsabilité de gérer des centaines d'applications tout en livrant de nouvelles fonctionnalités. Elles sont souvent cependant plus occupées à identifier et dépanner les problèmes logiciels. Nos clients nous confient qu'ils doivent relever de très gros défis avec ces applications et notamment maintenir les systèmes distribués et leurs dépendances, fournir une bonne expérience client et aller au-delà de la simple performance logicielle. Voici pourquoi et comment nos clients utilisent New Relic et l'observabilité pour monitorer et améliorer l'APM :
Gestion des systèmes distribués, outils et dépendances
Avant New Relic, DAZN, service de streaming sportif, utilisait un outil pour la télémétrie des applications côté client et un autre outil pour les logs en plus des dashboards CloudWatch et de centaines de comptes Amazon Web Services (AWS). Les équipes pouvaient observer leurs services et recevoir des alertes lorsqu'ils ne fonctionnaient pas correctement, mais elles ne travaillaient pas ensemble. Pete Tanton, ingénieur SRE principal chez DAZN, se souvient qu'une petite alerte pour une équipe pouvait causer un incident majeur pour une autre équipe. Lors des incidents, il était très compliqué de corréler les données, car les équipes devaient jongler entre plusieurs dashboards. DAZN avait une équipe SRE très compétente en charge du JML pour trois ou quatre outils différents, mais d'un point de vue administratif, il était clair que la gestion des utilisateurs et des mots de passe était une tâche lourde. En implémentant toutes ces données dans New Relic, DAZN peut maintenant afficher et interroger toutes les métriques CloudWatch et la télémétrie côté client dans un seul et même dashboard. Faciles à personnaliser, les dashboards New Relic extraient les données de n'importe où, même de sources tierces.
William Hill, société de paris en ligne, utilisait également différents outils de monitoring, dont un outil pour l'infrastructure et un autre pour l'APM. « C'était complètement chaotique », explique Stephen Wild, responsable ingénierie pour l'observabilité et l'automatisation chez William Hill. Les solutions n'arrivaient pas traiter le volume de données provenant des 18 000 nœuds, sans parler des conteneurs supplémentaires qui passaient via le cloud. Tout cela obligeait les équipes à intervenir la nuit. Depuis le déploiement de New Relic, le délai moyen de résolution (MTTR) a vu une amélioration de plus de 80 %. En termes de fiabilité, « c'est 100 % fiable. Nos systèmes n'ont jamais de temps d'arrêt », constate Stephen.
« Lors du dépannage d'un problème, la rapidité est essentielle », indique Kristian Lee, Responsable ingénierie DevOps chez Sportradar, une société spécialisée dans les technologies de paris sportifs. « New Relic rassemble toutes ces informations ainsi que le monitoring des applications et l'infrastructure dans un seul et même volet. Plus besoin de se connecter à plusieurs outils ! Toutes les informations sont disponibles au même endroit si on veut identifier une mauvaise configuration, voir s'il y a trop de charge ou ce qui ne fonctionne pas pour ensuite résoudre les problèmes rapidement », explique Kristian Lee.
Des informations exploitables sur les problèmes avant que la clientèle ne soit impactée
IGS, entreprise novatrice de l'agriculture de pointe, a un stack technologique basé sur les microservices et de multiples environnements avec de nombreux et différents systèmes générant des logs. IGS utilise les logs en contexte pour examiner la cause profonde des problèmes dans tous les systèmes dans une seule et même vue. Selon IGS, cette capacité a joué un énorme rôle dans sa récente réussite. Selon Owen Adams, directeur de l'ingénierie des plateformes chez IGS, le fait que l'entreprise peut désormais identifier rapidement ce qu'il s'est passé et où cela s'est passé dans le code, lui a permis de réduire son MTTR.
Au fur et à mesure qu'IGS augmente le volume des données dans son système, en cas de problème, il est crucial de pouvoir identifier d'où il vient. Avec le monitoring d'infrastructure et l'APM, IGS peut visualiser toutes les données d'infrastructure. « Au lieu d'avoir des personnes en charge du monitoring de la plateforme d'observabilité, nous nous concentrons maintenant sur les parties qui apportent de la valeur à notre clientèle ou à notre équipe de développement », précise Owen Adams.
Amélioration des workflows et de l'expérience utilisateur
Il arrive fréquemment que les entreprises utilisent différents prestataires pour le monitoring des utilisateurs réels (RUM), le monitoring des navigateurs et le tracing distribué pour les combiner souvent avec des composants open source. Malheureusement, la gestion de plusieurs outils et systèmes est une charge mentale pour les équipes. Les ingénieurs passent leur temps à essayer d'avoir une visibilité de tout le système en plus de traiter la charge administrative liée à l'ajout d'utilisateurs et à la gestion des mots de passe. Lorsqu'un problème survient, le dépannage implique de recouper les informations de différents outils, de différentes sources de données et d'autres mesures.
Une grande partie de l'intelligence d'alerte de DAZN s'appuie sur New Relic, indique Pete Tanton. L'intelligence appliquée signale de manière proactive aux équipes DAZN les problèmes potentiels en identifiant les comportements anormaux, en corrélant les incidents pertinents et en fournissant une analyse des causes profondes. New Relic diminue également la durée nécessaire au déploiement des services en rassemblant au même endroit les logs, les métriques, l'APM, la télémétrie côté client et les synthétiques. Au lieu d'avoir des personnes qui se consacrent au monitoring, IGS peut se focaliser sur la prestation d'une valeur forte pour l'activité de ses clients. De plus, l'instrumentation de New Relic s'est faite facilement. IGS a ajouté l'agent APM de New Relic dans un conteneur. L'agent couvrait 90 % du domaine et tout le domaine a été instrumenté en une journée et demie.
Redimensionner pour mieux économiser
Avant d'adopter New Relic, IGS dépensait entre 20 000 et 24 000 livres par mois pour le logging et le monitoring. Ce chiffre a été divisé de plus de la moitié, ce qui a libéré beaucoup de ressources. En cas de problème, New Relic donne à IGS la confiance nécessaire pour changer plusieurs choses à la fois. Pour Dave Scott, fondateur et directeur technique d'IGS, l'entreprise peut ainsi prendre plus de risques et innover plus rapidement avec ses produits en direct.
Inscrivez-vous pour obtenir un compte New Relic gratuit et installer le quickstart APM pour :
- Observer les performances de votre application en installant l'un de nos agents. C'est fait en quelques minutes.
- Monitorer les performances et l'intégrité de tous vos services dans un seul et même endroit.
- Coupler New Relic avec OpenTelemetry ou tout autre outil open source.
Les opinions exprimées sur ce blog sont celles de l'auteur et ne reflètent pas nécessairement celles de New Relic. Toutes les solutions proposées par l'auteur sont spécifiques à l'environnement et ne font pas partie des solutions commerciales ou du support proposés par New Relic. Veuillez nous rejoindre exclusivement sur l'Explorers Hub (discuss.newrelic.com) pour toute question et assistance concernant cet article de blog. Ce blog peut contenir des liens vers du contenu de sites tiers. En fournissant de tels liens, New Relic n'adopte, ne garantit, n'approuve ou n'approuve pas les informations, vues ou produits disponibles sur ces sites.