Qu’est-ce que la préparation à l’observabilité ?

Les activités de préparation à l'observabilité se traduisent par un monitoring proactif des indicateurs de performances clés (KPI) essentiels à vos objectifs commerciaux. Pour atteindre ces derniers, l'équilibre entre la couverture et l’exhaustivité du monitoring de l'application est crucial. Un équilibre optimal aide les organisations à corriger, optimiser et améliorer les flux de processus en fonction de l'expérience utilisateur et de la demande, ce qui entraîne ensuite une augmentation du retour sur investissement (ROI). La plateforme New Relic aide parfaitement et aisément les entreprises à atteindre leurs objectifs.

Pourquoi maintenant ?

  • Pour se démarquer sur un marché hautement concurrentiel, l’expérience client est primordiale.
  • Le développement agile exige la sortie de plusieurs versions, voire des centaines, sur une courte période.
  • En raison de l'abstraction, de l'intégration et de la complexité qui découlent de la modernisation des applications.

La préparation à l'observabilité doit faire partie de votre cycle de publication ou sprint. Elle aide : 

  • L’équipe des applications à s'aligner sur les objectifs commerciaux dynamiques. 
  • Les équipes DevOps et d'assistance à comprendre la gravité et la priorité d'un problème. 
  • Les entreprises à collaborer efficacement avec les équipes pour atteindre leurs objectifs.

En revanche, la préparation aux pics d'utilisation — qui est un sous-ensemble de la préparation à l'observabilité — est importante en termes d'évolution de vos ressources verticalement ou horizontalement.

Avantages d'une observabilité continue 

Chaque trimestre, votre entreprise a des objectifs qui correspondent à l'objectif annuel. L'observabilité doit s'aligner sur ces objectifs et aider les entreprises à l'atteindre. Par exemple :

  • Réduction des coûts opérationnels : les services cloud et l'infrastructure ne cessent de coûter de l'argent aux entreprises. Les mises à niveau, déploiements et modifications du système doivent être monitorés pour garantir une utilisation optimale des ressources. 
  • Satisfaction des clients : gagnez et renforcez la confiance de vos clients en sachant comment ils interagissent avec votre application et quels sont les goulots d'étranglement qu'ils peuvent rencontrer.  
  • Productivité des collaborateurs : assurez-vous que votre équipe connaît l'outil d'observabilité, ainsi que l'étendue de sa couverture, son exhaustivité et ses angles morts. 
  • RSI : les KPI commerciaux de surface les plus importants doivent être corrélés aux performances des applications. L’équipe de l’application peut ainsi se concentrer davantage sur les domaines problématiques critiques. 
  • Niveaux de service : suivez les services qui ne fonctionnent pas comme prévu sur une période donnée et qui affectent la productivité des collaborateurs et les KPI métier.

Processus de préparation à l’observabilité de New Relic

Examinons les étapes du cycle de vie de préparation à l'observabilité. 

1

Définir les objectifs commerciaux

Quel est l’objectif de l’année ou du trimestre en cours ? S'agit-il d'améliorer les temps de disponibilité, de réduire les temps d'arrêt, d'acquérir plus de visibilité ou d'adopter une nouvelle initiative commerciale comme la migration vers le cloud, la consolidation des outils, l'adoption d'OpenTelemetry, etc. ?

2

Choisir l'architecture d'observabilité 

Une étape cruciale consiste à garantir que l'architecture d'observabilité s'aligne sur les objectifs de l'entreprise. En choisissant la plateforme New Relic, vous pouvez décider librement des objectifs et de l'architecture de votre entreprise. En effet, la plateforme New Relic dispose de toute une palette de fonctionnalités et d'intégrations, elle a adopté l'open source et prend en charge les applications personnalisées pour répondre aux besoins spécifiques qui sont les vôtres.

3

Réaliser le monitoring des entités

Commencez le monitoring de vos applications avec New Relic, qui peut fournir un rapport en temps réel sur l'ensemble de votre patrimoine actuel ainsi qu'une visibilité sur la couverture et l'exhaustivité de l'observabilité.

4

Identification des lacunes                          

Il n'est pas toujours possible de monitorer tous vos services, applications, infrastructure, etc. Malgré cela, l’entreprise doit continuer de prospérer. Et pour y arriver les applications critiques ne doivent pas présenter d’angles morts ni omettre de données télémétriques ou métier. C’est l’occasion parfaite pour faire preuve de créativité et de trouver des solutions. Nous reviendrons sur ce point plus tard dans ce billet de blog.

5

Assurer l'implémentation et l'adoption

New Relic s'intègre à votre CI/CD (intégration et déploiement continus) et facilite l'implémentation. Des clients ont créé des modèles en utilisant les ressources New Relic sur Terraform, CloudFormation, les conventions, etc., ce qui leur permet de se concentrer sur l’adoption. En outre, l'équipe New Relic et le partenaire de l'écosystème sont à vos côtés pour faciliter votre parcours vers ces objectifs.

6

Mesurer les résultats

Les fonctionnalités de New Relic telles que le parcours des utilisateurs, la gestion des niveaux de service (SLM) et la gestion de la qualité des alertes (AQM) vous aident à mesurer les résultats en fonction des objectifs que vous avez définis.

7

Recommencer

Votre observabilité doit continuer de croître avec les besoins de vos applications et de votre entreprise.

Ce qui compte le plus : l'identification des lacunes !

Comment trouver les lacunes qui comptent le plus pour vous ? 

Souvenez-vous de l'expression : « le diable se cache dans les détails ». L’identification des applications et services critiques (entre autres) est simple et constitue un bon point de départ. 

Que faire pour les étapes suivantes ?

  • Posez des questions à des personnes jouant différents rôles (développeurs, utilisateurs et clients, par exemple).
  • Recueillez leurs commentaires/feedback
  • Obtenez les rapports sur les tickets créés au cours des n derniers mois
  • Effectuez des audits sur les applications existantes
  • Et ainsi de suite

Les points ci-dessus sont significatifs et basés sur des preuves et différentes expériences. Comment pouvons-nous devenir plus efficaces et combler les lacunes ? Avez-vous déjà entendu parler de l'ingénierie du chaos, du Game Day ou de DiRT ?

Reconnue en ingénierie informatique, l'approche de « l'ingénierie du chaos est la discipline qui consiste à expérimenter sur un système distribué afin d'améliorer la confiance dans ses capacités à résister à des turbulences en conditions de production ». (Wikipédia)

Réalisez des séances d'ingénierie du chaos 

Procédez à des séances d'ingénierie du chaos pour trouver les faiblesses du diagnostic des problèmes. L’ingénierie du chaos est comme un couteau suisse, elle vous aide à :

  • Activer et adopter la fonction et la fonctionnalité de la plateforme New Relic : les membres de l'équipe impliqués dans ces séances apprennent les uns des autres. Il doit s'agir d'un environnement non stressant dans lequel les membres de l'équipe peuvent examiner et partager leurs conclusions. Ils comprennent ainsi ce que l'on attend d'eux, à qui s'adresser et les subtilités du processus de gestion des incidents. 
  • Faire ressortir les angles morts : les angles morts entraînent un délai moyen de résolution (MTTR) plus élevé et nécessitent également une expertise spécifique lors du dépannage. 
  • Optimiser les données télémétriques : la communication entre les équipes, les unités commerciales et les différents rôles est essentielle. La séance d'ingénierie du chaos offre l’occasion de voir si nous avons toutes les données et points d’information requis. Par exemple, l'entreprise peut se demander pourquoi les ventes ont chuté au cours de la dernière heure, ce qui pourrait être le résultat de la modification d'une promotion, d'une panne de service chez un fournisseur, d'une dégradation des performances ou de toute autre raison qui n'a rien à voir avec l'application elle-même. 
  • Analyser l'effet en cascade des performances : une séance d'ingénierie du chaos vous permet d'évaluer et de comprendre la couverture et l'exhaustivité de l'observabilité. Sans couverture adéquate, il est fastidieux de décider du problème, de sa priorité et de sa gravité. 
  • Repérer les goulots d'étranglement : au début des années 2000, lorsque nous avions un problème, nous l'attribuions généralement à la base de données ou au réseau, et nous pouvions commencer à désigner les coupables. Aujourd’hui, nous arrivons au comble de l’abstraction, qu’il s’agisse du cloud, des microservices ou de l’infrastructure, et les applications sont désormais plus inter- et intra-dépendantes.

Nous pouvons effectuer l'ingénierie du chaos à l'aide d'outils tels que Gremlin, Chaos Monkey et Chaos Mesh, ou nous pouvons le faire manuellement.

Les séances d'ingénierie du chaos aident à déterminer ce qui est essentiel pour résister à des turbulences en conditions de production. Une fois que vous avez déterminé ce qui est essentiel, la plateforme New Relic peut, dès son lancement et sans intervention, vous fournir des informations sur les lacunes en matière de couverture, de recommandations et d'entités manquantes.

La plateforme New Relic comble les lacunes

Les lacunes identifiées varient et peuvent couvrir une vaste gamme de possibilités. Avec la plateforme New Relic, vous pouvez implémenter rapidement et organiquement les capacités dont vous avez besoin pour la préparation à l'observabilité. Quelle que soit votre approche préférée du dépannage (commencez-vous par les logs ou par les métriques ?), vous pouvez tirer parti des fonctionnalités de New Relic, telles que :

  • Les logs en contexte : ils fournissent une vue unifiée de vos logs aux côtés d'autres points de données télémétriques contextuelles. Cela garantit qu'il n'y a pas de changement d’outil ni de passage au peigne fin de centaines de lignes de logs, et l'analyse des causes profondes est plus rapide.
  • Les traces distribuées : elles fournissent une analyse approfondie du parcours des utilisateurs et vous permettent ainsi d'identifier les goulots d'étranglement des performances, quels que soient les multiples services impliqués tout au long du parcours de l'utilisateur.
  • Le suivi des changements/déploiements : le suivi des changements et des déploiements vous permet de surveiller de près les problèmes et de les réduire pendant et après l'un des événements les plus importants, le « déploiement » ou « Go Live », du cycle de développement de logiciels. 
  • La gestion des vulnérabilités : la gestion des vulnérabilités vous aide à identifier et à corriger les vulnérabilités dans l'ensemble de votre patrimoine, afin que vous puissiez réduire votre risque d'attaque.
  • OpenTelemetry : OpenTelemetry est une norme open source de collecte et d'exportation des données télémétriques, afin que vous puissiez utiliser New Relic pour collecter des données depuis n'importe quelle application ou infrastructure.
  • La gestion des niveaux de service : les SLA/SLM vous aident à définir et à suivre les accords de niveau de service (SLA) et les objectifs de niveau de service (SLO). Ils vous permettent de garantir que vos objectifs commerciaux sont atteints.
  • Les workloads : ils apportent la visibilité sur les performances de votre groupe de services. Ils peuvent aider une équipe à rester concentrée et opérationnelle. 

Suivez les bonnes pratiques de monitoring qui sont applicables à votre environnement particulier. Vous saurez ainsi que la couverture et la complétude de l’observabilité fonctionnent là où elles comptent le plus pour vous, ce qui vous aidera aussi à contrôler les coûts.

Récapitulatif

La préparation à l’observabilité est essentielle pour toute organisation cherchant à maintenir une approche proactive du monitoring et à améliorer ses applications et son infrastructure. En suivant le processus de préparation à l'observabilité et en tirant parti de toute la puissance de la plateforme New Relic, les entreprises peuvent garantir que leurs systèmes sont prêts à relever tous les défis tout en restant alignés sur leurs objectifs. N'attendez pas votre pic saisonnier ni un événement critique ; préparez-vous dès aujourd'hui à l’observabilité.