Les équipes d'ingénierie ont la responsabilité de gérer des centaines d'applications tout en livrant de nouvelles fonctionnalités. Elles sont souvent cependant plus occupées à identifier et dépanner les problèmes logiciels. Nos clients nous confient qu'ils doivent relever de très gros défis avec ces applications et notamment maintenir les systèmes distribués et leurs dépendances, fournir une bonne expérience client et aller au-delà de la simple performance logicielle. Voici pourquoi et comment nos clients utilisent New Relic et l'observabilité pour monitorer et améliorer l'APM :

Gestion des systèmes distribués, outils et dépendances

Avant New Relic, DAZN, service de streaming sportif, utilisait un outil pour la télémétrie des applications côté client et un autre outil pour les logs en plus des dashboards CloudWatch et de centaines de comptes Amazon Web Services (AWS). Les équipes pouvaient observer leurs services et recevoir des alertes lorsqu'ils ne fonctionnaient pas correctement, mais elles ne travaillaient pas ensemble. Pete Tanton, ingénieur SRE principal chez DAZN, se souvient qu'une petite alerte pour une équipe pouvait causer un incident majeur pour une autre équipe. Lors des incidents, il était très compliqué de corréler les données, car les équipes devaient jongler entre plusieurs dashboards. DAZN avait une équipe SRE très compétente en charge du JML pour trois ou quatre outils différents, mais d'un point de vue administratif, il était clair que la gestion des utilisateurs et des mots de passe était une tâche lourde. En implémentant toutes ces données dans New Relic, DAZN peut maintenant afficher et interroger toutes les métriques CloudWatch et la télémétrie côté client dans un seul et même dashboard. Faciles à personnaliser, les dashboards New Relic extraient les données de n'importe où, même de sources tierces.

William Hill, société de paris en ligne, utilisait également différents outils de monitoring, dont un outil pour l'infrastructure et un autre pour l'APM. « C'était complètement chaotique », explique Stephen Wild, responsable ingénierie pour l'observabilité et l'automatisation chez William Hill. Les solutions n'arrivaient pas traiter le volume de données provenant des 18 000 nœuds, sans parler des conteneurs supplémentaires qui passaient via le cloud. Tout cela obligeait les équipes à intervenir la nuit. Depuis le déploiement de New Relic, le délai moyen de résolution (MTTR) a vu une amélioration de plus de 80 %. En termes de fiabilité, « c'est 100 % fiable. Nos systèmes n'ont jamais de temps d'arrêt », constate Stephen.

Stephen Wild, Responsable de l'ingénierie pour l'observabilité et l'automatisation chez William Hill, explique comment New Relic a aidé l'entreprise à améliorer son MTTR de 80 %.

« Lors du dépannage d'un problème, la rapidité est essentielle », indique Kristian Lee, Responsable ingénierie DevOps chez Sportradar, une société spécialisée dans les technologies de paris sportifs. « New Relic rassemble toutes ces informations ainsi que le monitoring des applications et l'infrastructure dans un seul et même volet. Plus besoin de se connecter à plusieurs outils ! Toutes les informations sont disponibles au même endroit si on veut identifier une mauvaise configuration, voir s'il y a trop de charge ou ce qui ne fonctionne pas pour ensuite résoudre les problèmes rapidement », explique Kristian Lee.

Des informations exploitables sur les problèmes avant que la clientèle ne soit impactée

IGS, entreprise novatrice de l'agriculture de pointe, a un stack technologique basé sur les microservices et de multiples environnements avec de nombreux et différents systèmes générant des logs. IGS utilise les logs en contexte pour examiner la cause profonde des problèmes dans tous les systèmes dans une seule et même vue. Selon IGS, cette capacité a joué un énorme rôle dans sa récente réussite. Selon Owen Adams, directeur de l'ingénierie des plateformes chez IGS, le fait que l'entreprise peut désormais identifier rapidement ce qu'il s'est passé et où cela s'est passé dans le code, lui a permis de réduire son MTTR. 

Au fur et à mesure qu'IGS augmente le volume des données dans son système, en cas de problème, il est crucial de pouvoir identifier d'où il vient. Avec le monitoring d'infrastructure et l'APM, IGS peut visualiser toutes les données d'infrastructure. « Au lieu d'avoir des personnes en charge du monitoring de la plateforme d'observabilité, nous nous concentrons maintenant sur les parties qui apportent de la valeur à notre clientèle ou à notre équipe de développement », précise Owen Adams.

 

Intelligent Growth Solutions (IGS) fait pousser des aliments nutritifs et savoureux grâce à des tours de culture automatisées. Au fur et à mesure que l'activité d'IGS se développe, la quantité de données et la complexité des opérations s'accroissent. L'entreprise commence ses tests le plus tôt possible pour prédire les problèmes avant qu'ils ne surviennent en visualisant les performances logicielles dans les pipelines de développement et de simulation.

Amélioration des workflows et de l'expérience utilisateur

Il arrive fréquemment que les entreprises utilisent différents prestataires pour le monitoring des utilisateurs réels (RUM), le monitoring des navigateurs et le tracing distribué pour les combiner souvent avec des composants open source. Malheureusement, la gestion de plusieurs outils et systèmes est une charge mentale pour les équipes. Les ingénieurs passent leur temps à essayer d'avoir une visibilité de tout le système en plus de traiter la charge administrative liée à l'ajout d'utilisateurs et à la gestion des mots de passe. Lorsqu'un problème survient, le dépannage implique de recouper les informations de différents outils, de différentes sources de données et d'autres mesures. 

Une grande partie de l'intelligence d'alerte de DAZN s'appuie sur New Relic, indique Pete Tanton. L'intelligence appliquée signale de manière proactive aux équipes DAZN les problèmes potentiels en identifiant les comportements anormaux, en corrélant les incidents pertinents et en fournissant une analyse des causes profondes. New Relic diminue également la durée nécessaire au déploiement des services en rassemblant au même endroit les logs, les métriques, l'APM, la télémétrie côté client et les synthétiques. Au lieu d'avoir des personnes qui se consacrent au monitoring, IGS peut se focaliser sur la prestation d'une valeur forte pour l'activité de ses clients. De plus, l'instrumentation de New Relic s'est faite facilement. IGS a ajouté l'agent APM de New Relic dans un conteneur. L'agent couvrait 90 % du domaine et tout le domaine a été instrumenté en une journée et demie.

« Ça paraît évident de ne réveiller nos ingénieurs que pour des choses qui ont de l'importance pour les clients, mais c'est parfois difficile d'y réfléchir de ce point de vue. Changer la manière dont nous envisageons l'observabilité a été et continue d'être un processus très intéressant. » -Pete Tanton, Ingénieur principal SRE, DAZN

Redimensionner pour mieux économiser

Avant d'adopter New Relic, IGS dépensait entre 20 000 et 24 000 livres par mois pour le logging et le monitoring. Ce chiffre a été divisé de plus de la moitié, ce qui a libéré beaucoup de ressources. En cas de problème, New Relic donne à IGS la confiance nécessaire pour changer plusieurs choses à la fois. Pour Dave Scott, fondateur et directeur technique d'IGS, l'entreprise peut ainsi prendre plus de risques et innover plus rapidement avec ses produits en direct.