Dans le paysage numérique d'aujourd’hui, il est absolument essentiel d'assurer les performances, la disponibilité et la santé de l’infrastructure informatique. C'est là qu'intervient le monitoring d'infrastructure. À la base, ce système a été conçu pour fournir des informations détaillées en temps réel sur tout votre stack et garantir ainsi des performances optimales tout en signalant les problèmes potentiels avant qu'ils ne s'aggravent. Des services cloud aux serveurs sur site, nous allons explorer en profondeur le monitoring d'infrastructure, son importance, ses fonctionnalités et son impact sur les entreprises modernes. Vous êtes prêt ?

Qu’est-ce que le monitoring d’infrastructure ?

Le monitoring d'infrastructure est composé de logiciels qui vous aident à surveiller, identifier et résoudre rapidement les problèmes dans l'ensemble de votre infrastructure, y compris les services basés sur le cloud, les hôtes sur site, les conteneurs orchestrés et les machines virtuelles. Vous pouvez utiliser le monitoring d'infrastructure pour gagner l'observabilité complète sur des systèmes complexes et hybrides tels que les data centers et les services basés sur le cloud comme Amazon Web Services (AWS) et Microsoft Azure. Vous pouvez également l'utiliser pour générer une vue d'ensemble de l'unité centrale (ou CPU), de la mémoire RAM, du stockage et du trafic réseau de votre système. Grâce à ces informations détaillées, les ingénieurs peuvent identifier et résoudre les problèmes de performances au sein des serveurs, conteneurs, clusters Kubernetes, bases de données, services sur hôte, etc., qu'ils soient sur site ou dans le cloud. Plus précisément, le monitoring d'infrastructure fournit des métriques approfondies sur les performances, l'analyse rigoureuse des valeurs tendancielles et des informations prédictives détaillées qui permettent aux entreprises d'affiner leurs ressources, d'améliorer les temps de disponibilité et d'offrir un service efficace.

Lisez la suite pour en savoir plus sur le monitoring d'infrastructure et mieux comprendre son importance, mais aussi ce qu'il faut savoir lorsque vous cherchez un outil de monitoring d'infrastructure.

Qu’est-ce que l’infrastructure des applications ?

L'infrastructure des applications comprend tous les actifs qui permettent à vos systèmes et technologies de fonctionner, y compris les réseaux, les périphériques matériels et les serveurs, qu'ils soient basés dans le cloud ou sur site. Même lorsque vous utilisez des solutions cloud, l'infrastructure repose toujours sur un serveur physique quelque part. L'infrastructure des applications est semblable aux fondations d'un bâtiment : vous ne les voyez pas, mais elles soutiennent tout le bâtiment.

Vous pouvez penser à l’infrastructure des applications comme étant essentiellement composée de trois couches :

  • Le matériel : il comprend tous les composants physiques qui hébergent votre infrastructure. Il comprend les serveurs physiques et les processeurs, les périphériques réseau et les autres périphériques physiques utilisés par votre système. Cette couche est basée sur des micropuces, notamment des puces logiques (CPU) et des puces mémoire (RAM). Il existe également d'autres types de puces, dont les unités de traitement neuronal (NPU), conçues pour les applications d'apprentissage automatique.
  • Le système d'exploitation : il fournit une interface qui relie les deux autres couches de l'infrastructure des applications, soit le matériel et les applications elles-mêmes. Le système d'exploitation exécute les applications tout en utilisant également des ressources matérielles telles que le CPU et la mémoire RAM. Il comprend également les machines virtuelles, qui disposent de leurs propres systèmes d'exploitation.
  • L'application : il peut s'agir d'une application personnalisée que vous avez développée ou d'une application qui utilise un système de gestion de contenu comme WordPress. Cette couche comprend également des conteneurs, qui sont utilisés pour exécuter de nombreuses applications.

Si vous utilisez des serveurs sur site, vous devez réfléchir à toutes ces couches, en vous assurant notamment que votre matériel fonctionne correctement. Avec une infrastructure basée sur le cloud, vous n'avez plus à vous soucier du matériel comme auparavant, car votre fournisseur cloud gère l'infrastructure qui héberge vos logiciels et applications. Cependant, vous devez toujours penser à l'approvisionnement en ressources : CPU, mémoire, stockage et réseau. Si votre application est sous-provisionnée, elle ne fonctionnera pas correctement, mais si elle est surprovisionnée, vous gaspillerez de l'argent pour une capacité dont vous n'avez pas besoin.

L'image suivante montre un dashboard dans New Relic Explorer avec une vue de haut niveau des conteneurs, services, hôtes, etc.

How does infrastructure monitoring work?

Like other types of monitoring, infrastructure monitoring usually involves instrumenting a host by installing an agent. In the case of a monitoring solution like New Relic, you can begin the process of instrumentation with a simple guided installation. The agent automatically detects the application and log sources running in your environment and then recommends which ones you should instrument.

Once your hosts are fully instrumented, the agent will collect system data and send it to your infrastructure monitoring solution. In some cases, the agent will forward data and logs, particularly in the case of integrations.

The following chart shows how a New Relic on-host integration receives data from a service like Redis or Apache.

Pourquoi le monitoring des infrastructures est-il important ?

Que votre application utilise des hôtes basés sur le cloud ou sur site (ou les deux), l'infrastructure reste la base de vos systèmes. Tout comme un train ne peut circuler que sur des voies bien entretenues, votre système a besoin de serveurs performants et fiables pour garantir la bonne livraison des services à vos utilisateurs. Lorsque l'infrastructure tombe en panne, les performances de votre application en souffrent et vous pourriez même subir d'autres pannes. Les enjeux étant si élevés, la maintenance de l'infrastructure peut se révéler difficile et stressante. Et même si vos serveurs ont un temps de disponibilité proche de 100 %, les pannes qui surviennent peuvent s'avérer graves. En effet, les pannes et les temps d'arrêt ont un impact sur votre influence et la confiance de vos utilisateurs. Au mieux, vos utilisateurs ne peuvent pas accéder à vos services lors d'une panne, au pire, ils sont frustrés et ne reviennent pas.

Bien que vous puissiez monitorer des éléments tels que le CPU et la mémoire RAM d'un système sur une ligne de commande du système d'exploitation, vous avez besoin d'une solution plus complète pour le monitoring de l'infrastructure des applications, surtout lorsque celles-ci ne cessent de croître et de devenir plus complexes. C'est là qu'interviennent les outils de monitoring d'infrastructure. Un outil de monitoring d'infrastructure comme New Relic vous permet de visualiser l'ensemble de l'infrastructure de votre système en un seul endroit, dont les métriques, les événements, les logs et les traces (MELT).

Le monitoring d'infrastructure n'est qu'une partie de l'ensemble de la pratique de l'observabilité. L'observabilité consiste à collecter et visualiser les données de tous vos systèmes, y compris l'infrastructure, et à envoyer des alertes. Dans l'idéal, la plateforme que vous utilisez devrait également monitorer d'autres aspects de votre application, et notamment ses performances. Ainsi, vous pouvez identifier et corriger les erreurs qui surviennent dans votre infrastructure et ailleurs dans vos applications.

Les avantages du monitoring d'infrastructure sont les suivants :

  • Il aide à la recherche et à la résolution rapides des pannes et d'autres problèmes liés à l’infrastructure.
  • Il soutient vos équipes d’ingénierie, DevOps et informatiques qui travaillent avec l’infrastructure des applications et en dépendent.
  • Il apporte une expérience fiable et positive à l’utilisateur final, ce qui a ensuite un impact positif sur les résultats.

 

À quoi sert une solution de monitoring d'infrastructure ?

Une solution de monitoring d'infrastructure vous permet d'observer les différentes parties de l'infrastructure de vos applications. Avec New Relic, vous obtenez par défaut les éléments suivants dès que votre infrastructure est instrumentée :

  • L'état actuel du serveur, y compris le processeur, la mémoire, le disque et le réseau. 
  • L'usage et la capacité d'un périphérique de stockage associé au serveur.
  • Les données d'utilisation pour chaque périphérique réseau associé au serveur.
  • Les données sur tous les conteneurs Docker et clusters Kubernetes, y compris des métriques sur le CPU, la mémoire et la mise en réseau.
  • Tous les changements de l’état actif d’un système, stockés dans un InfrastructureEvent.

Outre l'instrumentation, vous pouvez également utiliser les intégrations pour analyser et visualiser les données provenant d'autres parties de votre infrastructure et pour recevoir des alertes. New Relic propose deux catégories principales pour les intégrations de l'infrastructure :

Une plateforme de monitoring d'infrastructure doit également offrir suffisamment de flexibilité pour vos propres solutions personnalisées. Vous pouvez même faire preuve de créativité et monitorer l’infrastructure de votre environnement résidentiel. Découvrez comment un ingénieur a utilisé New Relic pour effectuer le monitoring des panneaux solaires de sa maison.

L'image suivante montre un exemple de monitoring du cluster Kubernetes dans New Relic Explorer.

Les métriques du monitoring d'infrastructure

Les métriques du monitoring d'infrastructure font la lumière sur les performances et la fiabilité de votre système. Voici quelques métriques couramment monitorées :

Métriques sur le CPU

  • Usage du CPU
  • Charge moyenne du CPU
  • Temps d'inactivité du CPU
  • Temps d'attente du CPU

Métriques sur la mémoire

  • Mémoire totale
  • Mémoire utilisée
  • Mémoire libre
  • Permutations de pages mémoire

Métriques sur le disque

  • Taux de lecture/écriture du disque
  • E/S disque
  • Utilisation du disque
  • Capacité du disque

Santé de l'infrastructure

  • Temps de disponibilité/temps d'arrêt
  • Disponibilité du système
  • Erreurs matérielles
  • Statut du service/processus

Cette liste n'est pas exhaustive et les métriques peuvent varier en fonction de la nature exacte de l'infrastructure. Toutefois, elles permettent d'avoir une compréhension générale de la gamme de métriques essentielle au monitoring de votre infrastructure.

Cas d'usage du monitoring d'infrastructure

Le monitoring d'infrastructure représente les yeux et les oreilles des équipes informatiques. Il offre des informations détaillées qui s'étendent sur différents scénarios opérationnels, notamment :

  • La détection proactive des problèmes : avant qu'un problème mineur ne se transforme en panne majeure, les outils de monitoring d'infrastructure peuvent alerter les administrateurs pour qu'ils prennent des mesures.
  • Le monitoring du temps de disponibilité et des performances du site web : les outils de monitoring peuvent observer la santé du serveur web, la réactivité de la base de données et même l'expérience de l'utilisateur final en temps réel.
  • La planification de la capacité : analysez les données historiques pour prédire quand l'infrastructure pourrait potentiellement atteindre ses limites.
  • La conformité : le monitoring et le logging continus peuvent fournir une trace détaillée de l'activité, ce qui garantit le respect des normes de conformité.
  • Le retour d'information post-déploiement : pour les entreprises qui adoptent des pratiques DevOps, le monitoring fournit un retour d'information (feedback) après le déploiement, ce qui facilite la détection des inefficacités.

Comment fonctionne le monitoring d'infrastructure ?

Comme les autres types de monitoring, le monitoring d'infrastructure implique généralement l'instrumentation d'un hôte en installant un agent. Dans le cas d'une solution de monitoring telle que New Relic, vous pouvez commencer le processus d'instrumentation avec une simple installation guidée. L'agent détecte automatiquement les applications et les sources de log exécutées dans votre environnement, puis recommande celles que vous devez instrumenter.

Une fois vos hôtes entièrement instrumentés, l'agent collecte les données système et les envoie à votre solution de monitoring d'infrastructure. Dans certains cas, l'agent transmet les données et les logs, notamment dans le cadre des intégrations.

Le graphique suivant montre comment une intégration New Relic sur hôte reçoit des données d'un service comme Redis ou Apache.

MONITORING D'INFRASTRUCTURE NEW RELIC
Image of stacked rows of black, shiny, 3-D hexagons
Une résolution plus rapide des problèmes grâce au monitoring d'infrastructure de New Relic
En savoir plus sur le monitoring d'infrastructure avec New Relic En savoir plus sur le monitoring d'infrastructure avec New Relic

Tout comme les autres types de monitoring des applications, le monitoring d'infrastructure comprend des données provenant des MELT (métriques, événements, logs et traces).

Les logs sont des actions discrètes qui se produisent dans une application et représentent les éléments constitutifs des métriques, événements et traces. Ils sont constitués de lignes de texte uniques. Par exemple, un serveur NGINX consigne toutes les transactions effectuées. Les événements peuvent comprendre plusieurs lignes de données de log. Avec les traces (qui relient les événements entre eux), les événements fournissent plus de contexte sur ce qui se passe dans votre infrastructure.

Enfin, les métriques sont des données agrégées qui vous donnent une vue d'ensemble de ce qui se passe dans votre application. Il peut s'agir par exemple de la latence moyenne d’un service au cours des sept derniers jours. Les métriques vous donnent un contexte plus large et sont particulièrement utiles pour visualiser l'état et les performances globales de votre infrastructure. Il est également essentiel de savoir le rôle joué par les perturbations de l'infrastructure, car l'utilisation proactive des technologies pour stimuler l'innovation commerciale prend de plus en plus d'importance.

Les bonnes pratiques du monitoring d'infrastructure

  • Adoptez une approche globale : allez au-delà du monitoring de composants isolés et considérez l'ensemble de l'écosystème de l'infrastructure, dont les serveurs, les bases de données, l'équipement réseau et les applications.
  • Paramétrez des alertes exhaustives : lorsqu'un bon système d’alerte est en place, les équipes sont plus proactives. Choisissez stratégiquement les alertes que vous voulez recevoir.
  • Examinez régulièrement les métriques et les données collectées : assurez-vous que vos outils et paramètres de monitoring restent pertinents à mesure que votre infrastructure évolue.
  • Effectuez constamment des tests : lorsque vous testez votre infrastructure dans des conditions de charge élevée, vous verrez les points faibles potentiels et éviterez ainsi de vraies catastrophes.
  • Créez des dashboards de monitoring d'infrastructure pour votre équipe : ces dashboards sont le hub central qui vous permet de comprendre l'état de votre système actuel. Utilisez-les pour discuter et analyser les problèmes et collaborer sur leur résolution tout en ayant une compréhension collective des performances de l’infrastructure.

Choisissez le bon outil de monitoring d'infrastructure : sélectionnez un outil qui correspond aux besoins, à l'échelle et aux objectifs de votre organisation. N'oubliez pas de prendre en compte l'expérience des utilisateurs, les capacités d'intégration, la fiabilité et la rentabilité.

Pourquoi effectuer le monitoring d’infrastructure avec New Relic ?

Plongez dans l'avenir du monitoring d'infrastructure et de l'observabilité avec New Relic. Notre plateforme propose aux ingénieurs plus de 30 capacités puissantes dans les domaines de l'APM, de l'infrastructure, etc., mais elle est également accompagnée d'un modèle de tarification à la consommation qui élimine les frais de licence par utilisateur. Ainsi, vous pouvez gérer vos dépenses opérationnelles plus efficacement tout en donnant à tous les ingénieurs les outils dont ils ont besoin.

Une tarification avantageuse et transparente

Consolidez votre boîte à outils et gérez efficacement les coûts à mesure que vous évoluez. Avec la tarification à la consommation de New Relic, vous pouvez dépenser seulement un tiers de ce que vous dépenseriez avec Datadog. Pour voir le comparatif détaillé, consultez notre billet de blog New Relic et Datadog.

Brisez les silos de données pour une résolution rapide des problèmes

Dites adieu aux silos de données. New Relic connecte vos données d'APM et d'infrastructure et offre une visibilité illimitée sur tout votre stack. Cette vue globale permet aux équipes de résoudre les problèmes de performances jusqu'à 80 % plus rapidement, quelle que soit l'équipe.

Une collaboration transparente entre les équipes

Notre plateforme d'observabilité unique sert de source factuelle unifiée et uniformisée et permet aux ingénieurs de toutes les équipes de collaborer efficacement lorsque des problèmes surviennent. Aucun outil supplémentaire n'est requis et il n'est pas nécessaire de passer par le service d'achat pour ajouter un utilisateur ou des SKU.

Lancez-vous dès aujourd'hui

Inscrivez-vous au Free Tier de New Relic et découvrez notre documentation complète sur le monitoring d'infrastructure et les bonnes pratiques. Bénéficiez d'une expérience pratique grâce à notre atelier sur l'identification des causes profondes des problèmes dans votre infrastructure.

 

Découvrez dès aujourd’hui la différence New Relic et transformez votre façon de monitorer, observer et optimiser votre infrastructure.