Access garde les réservations enregistrées et les clients satisfaits

L'évolutivité est l'une des principales priorités commerciales d'Access. Avec plus 60 000 clients, Access propose de nombreux produits différents dans divers secteurs et obtient un environnement hybride multicloud. Son objectif est de devenir 100 % SaaS dans les cinq ans et de gagner une vue de bout en bout de ces transactions commerciales. Pour Access, le dynamisme et la croissance sont essentiels, et les clients se trouvent au cœur de tout cela.

99 %
de réduction du bruit des alertes
1000 £
d'économie sur la facture mensuelle d'AWS
30 %
d'utilisation de base de la B2D (contre 60 % auparavant)

Un environnement hybride doit être disponible 24h/24 et 7j/7 

Outre l'intégration des services internes, un des défis consistait à repérer les problèmes de disponibilité et de fiabilité sur tout le stack. Les ingénieurs logiciels étaient sans arrêt confrontés au bruit des alertes. Ils pouvaient se réveiller avec plusieurs messages dans leur boîte aux lettres contenant des alertes provenant de différents environnements. Afin de distinguer le bruit des alertes inutiles de celui des alertes critiques, les ingénieurs devaient aller chercher dans la pile de tickets existants et trouver le code, ce qui pouvait prendre des heures. Cela créait une distraction indésirable des tâches essentielles, telles que l'évolutivité et l'envoi de nouvelles fonctionnalités. Access voulait mettre en place de nouvelles technologies pour obtenir une vue centralisée de tous les systèmes et capitaliser sur le dynamisme et la croissance déjà atteints.

La visibilité sur tous les systèmes permet de faire des économies de temps et d'argent

Le monitoring des performances des applications (APM) de New Relic permet d'obtenir une carte des systèmes internes et externes, ce qui permet aux ingénieurs d'avoir une approche data-driven de leur travail. Les alertes New Relic automatisent et rationalisent le processus de gestion des incidents en permettant aux ingénieurs de se concentrer sur la publication de nouvelles fonctionnalités et d'autres tâches essentielles. New Relic aide Access à améliorer les performances et les processus en unifiant et uniformisant les informations détaillées et en résolvant les problèmes de manière proactive avant que les incidents n'impactent les clients.

Il fut un temps où je passais chaque heure de la journée à recherchait d'où provenait le bruit des alertes. Maintenant, si une alerte New Relic se déclenche, je vois le problème immédiatement. Toutes les informations sont déjà là, sur la page de l'incident via le serveur. Et je ne passe désormais que 10 minutes à recherche le problème que je résous ensuite plus vite.

Les bonnes pratiques d'alertes permettent aux ingénieurs de se concentrer sur ce qu'ils font de mieux

Le bruit des alertes a été réduit de 99 %. Les équipes reçoivent maintenant neuf alertes par jour en moyenne. Les alertes configurables font remonter les signaux les plus importants et l'équipe peut peaufiner les alertes en fonction des métriques, des événements, etc. L'équipe peut également mettre les alertes en sourdine en fonction de ses workflows.

« Nous sommes bien plus rapides avec les alertes. Lorsque l'équipe sait ce qu'il faut rechercher, cela évite de nombreuses larmes et beaucoup de réunions, » affirme Richard Bowen, architecte des données chez The Access Group.

En cas de processus lent, il est identifié, jusqu'à la ligne de code. Les alertes New Relic peuvent s'intégrer à de nombreuses plateformes de productivité, telles que les SMS et Slack, y compris l'usage du CPU et le nombre de threads en cours d'exécution. Ce processus est automatisé et exécuté en fond, afin que les informations soient facilement disponibles et facilement interrogeables. Et parce que le travail de recherche est éliminé, il est possible de travailler sur la chaîne de code pour la publier rapidement dans le sprint suivant. En ayant toutes les alertes et données sur une plateforme unifiée et uniformisée, sans nécessiter de changer d'outils, les ingénieurs logiciels et les développeurs peuvent détecter des problèmes de manière proactive pour répondre aux incidents plus rapidement et plus simplement. 

La configuration avec New Relic est simple : vous installez l'agent. Vous obtenez une vue sur la façon dont vos services communiquent entre eux. Vous pouvez voir les métriques à partir de toutes les interactions de vos services, y compris les problèmes de performances en dehors de votre système. D'autres plateformes cloud semblables exigent plus de temps de configuration et de frais généraux.

Des informations détaillées en temps réel sur l'infrastructure et les bases de données

Le gain de visibilité sur les systèmes distribués permet à Access de repérer les transactions lentes qui impactent les clients et d'autres transactions dans l'écosystème—avec la possibilité de faire la distinction entre les processus internes et tiers. Par exemple, pendant plusieurs années, on pensait qu'un processus tiers prenait 27 secondes. Lorsque New Relic a été lancé, l'équipe a découvert que le processus tiers lent était en fait interne. L'ancien code a été réécrit en une journée et ajouté au sprint suivant. C'est un ingénieur logiciels qui avait suivi la formation New Relic la veille qui l'a découvert.

Access a également pu réduire le nombre de machines dans ses clusters et ainsi réduire le coût du cloud en identifiant les serveurs qui étaient occupés. Une base de données qui tournait précédemment à 60 % est maintenant à 25 %-30 %, ce qui permet d'économiser environ 1 000 GBP par mois. La base de données quotidienne — qui tournait à 60 %-80 % pendant les périodes de pointe — tourne aujourd'hui à 4 %. 

Les équipes d'ingénieurs se concentrent sur les tâches critiques à leur mission

Access devance les problèmes des clients et les résout avant qu'ils n'atteignent les clients ou l'équipe d'assistance. Ceci permet aux équipes de se concentrer sur le rôle qu'elles ont — sortir de nouvelles fonctionnalités et innover — au lieu de pourchasser les erreurs. Maintenant que les alertes sont en place, les ingénieurs d'Access font des recherches approfondies dans d'autres métriques et KPI pour en savoir plus sur la façon dont les clients utilisent le produit — le nombre de clients utilisant une application ou un processus, par exemple. Ces informations sont essentielles à la priorisation du backlog et les ingénieurs peuvent voir les activités qui auraient eu le plus gros impact sur les clients. « OpenTelemetry est un élément très important de la partie finale que constituent les métriques de l'activité et l'instrumentation des clients, » confie Richard Bowen.