New Relic One : La plateforme d'observabilité complète et simplifiée

Introduction

Les microservices et les systèmes distribués permettent aux développeurs d’augmenter l’agilité, l’évolutivité et l’efficacité des charges de travail critiques et des applications orientées client. Ça, c'est une bonne nouvelle ! Mais malheureusement, il y a aussi une mauvaise nouvelle. Le débogage et le monitoring de ces éléments sont de plus en plus compliqués par l’abstraction de l’infrastructure hors de l’entreprise, et par l’éparpillement des applications entre de nombreux services tiers, legacy, API métier et solutions cloud modernes.

Lorsqu’un incident sans origine claire se produit, vous avez peut-être du mal à le trouver, le diagnostiquer et le résoudre. Ces difficultés peuvent avoir ensuite des répercussions négatives sur plusieurs couches du stack d’applications. Pour votre entreprise, cela peut se traduire par une baisse du chiffre d'affaires et une chute de sa réputation lorsque les propriétés numériques ralentissent ou échouent.

Le nombre toujours grandissant d’éléments à monitorer et sur lesquels il faut agir met la pression sur les équipes et les budgets : environnements hybrides, zone à surfacer toujours plus grande, augmentation des données opérationnelles émises par des outils fragmentés, alertes continuelles, etc.

Certaines entreprises ont dû adopter des dizaines d’outils de monitoring commerciaux et open source pour y arriver. L’objectif final est d'avoir une plus grande visibilité sur les logiciels et les systèmes. Mais quand on a toute une gamme de solutions déconnectées les unes des autres (pour l’infrastructure, les applications, les logs, l’expérience numérique, etc.), on finit par créer un éparpillement ingérable des outils. Les ingénieurs doivent alors constamment passer d’une solution à l’autre pour découvrir les problèmes, ce qui crée des inconnues, ajoute une charge de travail supplémentaire, et pose des défis inutiles, généralement aux moments critiques.

En outre, il ne faut pas oublier les coûts qui ne cessent d'augmenter au niveau du temps d'apprentissage et d’adoption chez les développeurs, mais aussi des frais d’exploitation et d'investissement. Et bien que les outils open source semblent une bonne occasion d’éviter les frais de prestataires, de nombreuses organisations ont du mal à prévoir l’infrastructure finale et les efforts nécessaires pour maintenir et exploiter ces solutions.

La création de logiciels à optimisation améliorée dans des conditions de plus en plus complexes

Malgré tous ces défis, la plupart des ingénieurs ont le même objectif unique : créer et maintenir du code performant en production. En cas de problèmes, il leur faut comprendre, trouver et résoudre la situation rapidement.

La production de logiciels à optimisation améliorée est un défi permanent, mais les entreprises qui y arrivent constatent trois retombées importantes :

Des temps de disponibilité et de performances améliorés. Pour assurer une expérience client numérique exceptionnelle qui accélère le taux d’engagement, la conversion et l’affinité avec la marque, vos équipes de développement et d’exploitation doivent avoir la visibilité et les outils nécessaires pour identifier, diagnostiquer et résoudre les problèmes rapidement.
Une plus grande évolutivité et efficacité. Avec la croissance de votre entreprise, vous devez conserver le contrôle ferme de vos environnements quand : vous migrez les charges de travail vers le cloud pour gagner en évolutivité (scalabilité), vous refaites l’architecture et l’infrastructure des applications, et vous adoptez des architectures comme les microservices et le serverless. Vous devez aussi rationaliser les outils disparates pour éliminer les silos de données, activer la visibilité intégrale et réduire les coûts. Les recherches que nous avons réalisées indiquent qu'en moyenne, les participants interrogés collectent les données télémétriques de moins de la moitié de leurs systèmes.
Une commercialisation plus rapide. Les consommateurs sont aujourd'hui plus exigeants que jamais. Vous devez vous assurer que vos équipes de développement disposent de données et d'outils qui supportent la livraison plus rapide des fonctionnalités, la récupération rapide, et plus d’expérimentation afin d'engendrer des avantages commerciaux concurrentiels. Vous devez également gagner en agilité avec des pratiques de publication continue telles que la gestion des configurations, l’intégration continue et l’automatisation des tests. Les équipes DevOps qui réussissent encouragent une culture de collaboration et de visibilité, pour que les ingénieurs de toutes les branches de l'entreprise puissent partager leurs connaissances, mieux coordonner leurs efforts et savoir exactement sur quoi se concentrer.

Pour atteindre ces objectifs de temps de disponibilité et performances améliorés, de plus grande évolutivité et efficacité, et de commercialisation accélérée, les équipes IT doivent prioriser l’observabilité.

L'observabilité : vaincre les défis posés par les systèmes modernes

Le temps des rares sorties de logiciels en cascade dans des applications monolithiques appartient désormais au passé. Aujourd'hui, des équipes disparates poussent continuellement en production des mises à jour logicielles vers des architectures éphémères telles que les conteneurs.

Le changement (d’infrastructure, de code et de comportement de l’utilisateur final) est emblématique de la réalité des systèmes modernes, mais il ne comporte pas obligatoirement de risques. Il vous suffit d'avoir des partenariats technologiques qui peuvent vous aider à équilibrer efficacement fiabilité et rapidité du système.

Afin de pouvoir comprendre les dépendances pour toutes les branches organisationnelles, mais aussi dépanner et résoudre les problèmes plus rapidement, vous devez savoir comment toutes vos applications et leurs services et systèmes sous-jacents interagissent.

Vous décrochez le Graal quand vous pouvez poser les questions pertinentes sur vos données en temps réel, même (et surtout) si vous n’aviez pas initialement anticipé le besoin de poser ces questions. Ainsi, vous atteignez l’observabilité.

En termes simples, l'observabilité, c'est votre capacité à bien comprendre votre système numérique complexe. Elle comprend la collecte proactive des données opérationnelles (métriques, événements, logs et traces, ou MELT) en un seul et même endroit, la visualisation des connexions entre ces données au travers d'expériences intuitives, et l'application de l'intelligence pour instantanément détecter, diagnostiquer et résoudre les problèmes avant que vos clients ne s'en rendent compte. Si le monitoring vous dit que quelque chose ne va pas, l'observabilité vous permet de demander pourquoi.

New Relic One : L’observabilité simplifiée

Pour maîtriser l'observabilité, vous devez disposer de la plateforme technologique adéquate. Celle-ci doit pouvoir ingérer les données télémétriques à partir de n'importe quelle source (qu'elle soit exclusive ou open source). Elle doit vous accorder la flexibilité d'interroger vos données télémétriques, vous donner une vue à 360° des inconnues connues, et vous permettre d'examiner les « inconnues inconnues » de vos systèmes dynamiques. La cardinalité ne peut pas être une limite.

C'est ici que New Relic One entre en scène. La plateforme d'observabilité cloud développée pour vous aider à améliorer l'optimisation de vos logiciels vous propose trois composants clés :

Full-Stack Observability vous permet de visualiser, d'analyser et de dépanner facilement tout votre stack de logiciels en une expérience connectée. Ainsi, vous n'avez plus à passer d'un outil à l'autre ni à essayer de trouver la logique entre des données éparpillées pour démêler les raisons du problème. Avec des analyses riches et une expérience utilisateur organisée, Full-Stack Observability fait remonter à la surface le contexte dont vos équipes ont besoin pour trouver et résoudre plus rapidement les problèmes au sein de votre infrastructure, des applications, et de l'expérience utilisateur.

Applied Intelligence vous donne la possibilité de détecter, de comprendre et de résoudre les incidents plus rapidement. En maîtrisant la puissance de l'intelligence artificielle et l'apprentissage machine, Applied Intelligence propose les capacités AIOps qui réduisent les alertes inutiles et vous aident à diagnostiquer les informations dans les données qui passeraient autrement inaperçus.

Telemetry Data Platform vous permet d'ingérer, de visualiser, et de recevoir des alertes sur tous vos événements, métriques, logs et traces à partir de n'importe quelle source, le tout au même endroit. La base de données télémétrique open source uniformisée et gérée la plus puissante au monde est désormais fournie avec des intégrations prêtes à l'emploi à des outils open source populaires, qui permettent de configurer et d'éliminer facilement les frais et les complexités d'hébergement, d'exploitation et de gestion des systèmes de monitoring ou de datastores supplémentaires. Avec toutes vos données télémétriques au même endroit, vous pouvez interroger les « inconnues inconnues » en toute confiance.

Full-Stack Observability

Full-Stack Observability vous apporte une expérience du monitoring simple, intuitive et organisée sur tout votre parc : des applicatifs et infrastructure à l'utilisateur final, en passant par les logs et applications serverless. Vous gagnez des connexions automatiques à vos données, quel que soit le type de télémétrie ou l'endroit où ces données ont été gérées dans le stack. Et vous obtenez ainsi le contexte rapide dont vous avez besoin pour suivre les fils d'Ariane communs.

Full-Stack Observability vous permet d'interpréter et de résoudre les problèmes sur tout votre stack de logiciels à partir d'une seule interface organisée et uniformisée. Vous disposez des fonctionnalités essentielles suivantes :

New Relic Explorer

new relic navigator example in dark mode

New Relic Explorer propose une expérience intuitive pour visualiser et explorer toutes vos données de télémétrie, quelle qu'en soit la source : des hôtes de l'infrastructure aux applications mobiles, des services distribués aux API cloud en passant par tous les autres éléments. Découvrez les problèmes émergents en temps réel sans dépendre de seuils ou de dashboards statiques et préconfigurés. Vous pouvez ainsi remettre votre système sur pied avant que vos clients ne remarquent quoi que ce soit.

Obtenez des réponses plus rapidement. Éliminez les silos et donnez à vos équipes la possibilité d'observer tout le système en un seul et même endroit afin qu'elles puissent comprendre rapidement l'état de santé et l'impact des changements pour tout l'environnement et résoudre les problèmes plus rapidement. Pour obtenir ces informations immédiatement, aucune configuration n'est nécessaire.
Visualisez tout en un seul et même endroit. Obtenez une vue sur toutes les données télémétriques de votre domaine avec une analyse des changements en temps réel qui vous aide à trouver les anomalies dans l'environnement d'exploitation.
Simple et intuitif. Vos équipes peuvent parcourir efficacement de grands systèmes distribués grâce à des vues intuitives qui permettent de comprendre rapidement ce qui se passe et de prioriser les problèmes. Les possibilités d'exploration de toutes vos données sont illimitées et faciles avec en plus le filtrage et le groupement de toutes les entités selon le type ou les balises par simple pointer-et-cliquer.

APM

APM propose des vues détaillées, organisées et personnalisées des applications modernes, quelle que soit la manière dont elles ont été développées ou l'endroit où elles sont exécutées. Avec l'instrumentation prête à l'emploi et des workflows opiniâtres, APM vous permet de rapidement détecter les anomalies, découvrir les défauts et améliorer la performance sur les métriques clés pour les applications et les services distribués métier. Avec APM, les équipes peuvent :

Livrer rapidement les nouvelles fonctionnalités. La grande visibilité organisée à partir d'un seul écran réduit la complexité et les risques, et vous permet de vite déployer les services en toute confiance.
Résoudre les problèmes de panne rapidement. Déterminez les causes profondes et résolvez les problèmes rapidement grâce aux détails de transaction qui indiquent les appels de méthode précis avec leur numéro de ligne, en incluant les dépendances externes pour les applications de quelques taille et complexité que ce soit.
Optimiser les performances de service. Obtenez une vue complète en combinant les métriques clés provenant des applications mobiles et sur navi- gateur avec services associés, datastores et hôtes.

Monitoring de l'infrastructure

Avec le monitoring de l'infrastructure, vous comprenez rapidement ce qui se passe dans votre infrastructure, et notamment les serveurs qui tournent sur les sites, les machines virtuelles (VM) dans le cloud, les conteneurs orchestrés par Kubernetes, ou toute autre combinaison qui en résulte. Réalisez le monitoring intuitivement, gérez, évoluez, corrélez et optimisez l'infrastructure qui prend en charge vos applications. Avec le monitoring de l'infrastructure, les équipes peuvent :

Empêcher les pannes grâce au monitoring contextuel. Interprétez en toute confiance les relations et les dépendances complexes dans votre environnement d'exploitation distribué. En corrélant la télémétrie de l'infrastructure avec les logs, les changements apportés à la configuration et les données de performance des applications, vos équipes peuvent surfacer les données en contexte et ainsi comprendre l'impact qu'ont l'infrastructure et les applications les unes sur les autres.
Obtenir une représentation multidimensionnelle des clusters Kubernetes. Explorez dans le détail les données et métadonnées Kubernetes dans une interface organisée haute-fidélité qui simplifie les environnements complexes.
Profiter des intégrations pour le cloud. Les intégrations prêtes à l'emploi offrent un ensemble de télémétries complet des services (bases de données, serveurs Web, périphériques réseau, moteurs de recherche, systèmes de file d'attente et fournisseurs cloud).
Faire des recherches sur toute l'infrastructure hôte. Le monitoring de l'infrastructure collecte des informations détaillées sur la configuration système par hôte, dont les modules système, les fichiers de configuration, les métadonnées, les packages, les services, les sessions utilisateurs, et bien plus encore.

Monitoring serverless

Le monitoring serverless donne une visibilité uniformisée des comportements les plus infimes de vos applications sans serveur. Cette fonction permet à vos équipes de travailler plus vite et de publier avec plus d'assurance sur les architectures serverless. Avec le monitoring serverless, les équipes peuvent :

Éliminer les bugs intelligemment. Livrez des applications sans serveur en toute confiance en détectant rapidement l'apparition de problèmes et en mettant vite le doigt dessus sans perdre votre temps à parcourir laborieusement des millions de logs d'invocation.
Passer moins de temps à instrumenter et plus à développer. Auto-instrumentez le monitoring et l'observabilité au niveau des fonctions serverless sans devoir modifier le code.
Profiter d'une visibilité uniformisée de tout votre écosystème. Le monitoring serverless vous permet d'auto-instrumenter le tracing des composants des anciennes applications parallèlement à celui des performances des composants sans serveur modernes, et ce, de l'infrastructure backend jusqu'aux applications client.

Monitoring de l'expérience

Obtenez rapidement la visibilité qu'il vous faut sur l'expérience utilisateur avec vos applications mobiles et Web. Analysez le comportement réel ou simulé de l'utilisateur pour peaufiner les métriques telles que le temps de chargement, la disponibilité et les erreurs, tout en restant ancré dans les services backend qui permettent ces expériences numériques critiques. Avec le monitoring de l'expérience numérique, les équipes peuvent :

Maintenir la stabilité des applications mobiles. Identifiez les plantages qui ont le plus gros impact sur votre application et résolvez-les plus rapidement avec le fil d'Ariane et la piste vers l'événement.
Analyser la performance et la latence aux points de terminaison. Détectez et résolvez les problèmes de disponibilité et de performance des points de terminaison des services, URL et API au niveau des applications côté client et employé.
Explorer l'engagement et l'activité du client. Sachez comment vos nouvelles versions impactent les KPI de votre application mobile, des principaux utilisateurs et de l'activité globale.
Optimiser l'expérience client. valuez et améliorez la rapidité et la performance du site pour accroître l'engagement et la satisfaction client, et ainsi les résultats.
Éliminer les erreurs. Ayez à votre disposition tous les outils et le contexte dont ont besoin les équipes interfonctionnelles pour rapidement dépanner et résoudre les erreurs, la latence et les anomalies au fur et à mesure que vous apportez des modifications aux transactions de bout en bout et JavaScript.

Logs contextuels

Les logs contextuels proposent la visibilité nécessaire sur toutes les données texte ou numériques pouvant être converties en texte, dont l'origine est soit sur site, soit dans le cloud. Avec les logs contextuels, les équipes peuvent :

Dépanner les problèmes plus rapidement. La combinaison des logs avec d'autres types de données télémétriques permet d'obtenir une observabilité complète. Avec la visibilité des logs corrélés à l'échelle, les équipes peuvent dépanner les systèmes distribués plus vite et réduire le MTTD (temps moyen de détection) et le MTTR (temps moyen de résolution). Un simple clic vous fait passer des erreurs, traces, ou spans aux logs corrélés pour analyser rapidement les causes profondes.

Applied Intelligence

Détectez, interprétez et résolvez les incidents plus rapidement avec des capacités Applied Intelligence puissantes et simples d'utilisation qui réduisent le vacarme des alertes inutiles et révèlent des informations critiques qui ne seraient pas décelées sans l'apprentissage machine.

Les avantages et fonctions d'Applied Intelligence sont les suivants :

Une connexion plus rapide et une valeur accrue. Connectez les outils (Slack, PagerDuty, Splunk, Grafana, Prometheus, Amazon CloudWatch) que vous utilisez déjà en quelques clics avec notre interface de configuration guidée, les webhooks et les API. Ingérez les alertes, les incidents, et les données d'événements à partir de n'importe quelle source.
La détection automatique des anomalies avec leur contexte. Réalisez le monitoring de vos services de manière proactive pour détecter les anomalies en fonction des signaux dorés SRE (latence, erreurs et trafic, par exemple) et recevez des notifications avec des avertissements d'échec en temps réel et l'analyse des anomalies pour résoudre les problèmes plus rapidement.
La réduction du bruit et de la fatigue créés par les alertes inutiles. Établissez des relations entre les incidents, y compris la détection et la suppression intelligente des flottements afin de réduire le bruit créé par les alertes de faible priorité et de résoudre automatiquement jusqu'à 90 % des alertes.
L'intégration d'une logique décisionnelle dans les corrélations. Développez rapidement une logique de corrélation grâce à un créateur décisionnel intuitif qui indique à AI quelles sont les données à comparer, quelles sont celles à corréler, quelle est la période maximale à prendre en considération, et quel est le nombre minimum d'alertes à corréler. Vous pouvez même choisir des algorithmes de similarité prêts à l'emploi, ce qui vous donne les pleins pouvoirs et le contrôle sur le processus.
Une complète transparence sur la corrélation des incidents. Profitez d'une transparence totale sur le fonctionnement des corrélations et soyez sûrs que les signalements critiques ne passent pas inaperçus.
Un diagnostic et un temps de réponse plus rapide grâce à l'intelligence sur les incidents. Enrichissez les incidents corrélés avec un contexte et des métadonnées plus étoffés, pour dépanner et interpréter les problèmes, comprendre leur origine profonde, et les résoudre plus rapidement.
La remontée plus rapide des incidents jusqu'aux intervenants adéquats. Acheminez les incidents corrélés aux membres de l'équipe les mieux armés pour agir et éliminez le bruit des alertes mal distribuées.
Aucun changement du workflow de réponse aux incidents en place. Envoyez des informations corrélées et riches sur les incidents directement dans des outils comme PagerDuty, OpsGenie, ServiceNow, etc. pour que vous n'ayez pas à réinventer la réponse aux incidents.

Telemetry Data Platform

Les fonctionnalités et expériences obtenues dans Full-Stack Observability et Applied Intelligence sont toutes fournies par Telemetry Data Platform, une base de données chronologique extrêmement évolutive qui permet aux équipes de collecter, explorer, et recevoir des alertes sur tous les événements, métriques, logs et traces de n'importe quelle source, le tout au même endroit.

Avantages de Telemetry Data Platform :

La plateforme SaaS. Une puissante plateforme SaaS à forte disponibilité, résilience et évolutivité avec rétention à long terme, pour que vous n'ayez pas besoin d'exploiter ni de gérer de systèmes supplémentaires.
Une base de données télémétriques open source uniformisée. Un seul et même endroit pour ingérer, analyser, visualiser et envoyer des alertes sur tous les événements, métriques, logs et traces, afin que vous puissiez développer des dashboards pour interpréter et résoudre les problèmes plus rapidement que jamais.
Un niveau entreprise. Les critères de sécurité et de chiffrement les plus stricts ont été utilisés pour le développement et l'exploitation de la plateforme, dont le chiffrement au repos et le RBAC (contrôle des accès à base de rôles), afin d'assurer le respect des exigences réglementaires et de conformité, tels que FedRAMP et GDPR. Des experts dédiés sont disponibles 24 h/24 et 7j/7 via le service client.
Une solution complète qui évolue avec vous. Profitez de l'innovation des équipes de développement exclusives de New Relic ainsi que de la communauté open source qui développent une large gamme de solutions.

Gagnez en visibilité sur vos systèmes complexes avec New Relic One

Avec New Relic One, les ingénieurs passent moins de temps à résoudre les problèmes et plus à développer des logiciels à optimisation améliorée. La plateforme SaaS extensible à forte évolutivité peut collecter toutes les données sur l'infrastructure et les applications, visualiser rapidement ces données dans des vues associées et appliquer les techniques d'apprentissage machine pour vous apporter d'énormes avantages tels que la détection des anomalies, la corrélation des événements et la suppression des alertes. Bienvenue dans l'ère de l'observabilité pour tous.