Par Guy Fighel, 17 mars 2021

Malgré tout le battage médiatique, nombreuses sont les équipes DevOps et SRE qui ont du mal à faire des promesses de l'AIOps, une réalité. Les difficiles courbes d'apprentissage, les temps d'implémentation et de formation longs, le prix prohibitif, et un manque de confiance dans l'intelligence artificielle (AI) et l'apprentissage machine (ML) constituent autant d'obstacles. Quand nous interrogeons les ingénieurs d'astreinte avec leur pager en poche, ils mentionnent systématiquement trois défis auxquels ils sont confrontés et qui gênent l'opération continue des services :

  1. La découverte des problèmes émergents et des inconnues est difficile quand on dépend des alertes ou de dashboards statiques pour savoir ce qui change.
  2. Il n'est pas facile de trier les incidents et de savoir y répondre quand une défaillance en cascade se produit avec des alertes déclenchées sur plusieurs outils.
  3. Le diagnostic des causes profondes des problèmes est difficile et chronophage quand on doit passer au peigne fin les dashboards afin de comprendre les raisons pour lesquelles un problème s'est produit et les éléments qui sont impactés.

En résumé, les ingénieurs ne peuvent plus se permettre d'avoir des centres de crise coûteux ni de compter sur des hypothèses approximatives pour dépanner les incidents, ou pire, apprendre par les clients qu'il y a des problèmes. Tout cela change aujourd'hui avec le lancement de la nouvelle génération de New Relic Applied Intelligence, qui facilite plus que jamais :

  • La détection des changements anormaux instantanément : Vous pourrez détecter automatiquement les anomalies sur toutes vos applications, services, et logs afin d'empêcher les problèmes potentiels avant qu'ils n'impactent les clients.
  • La réduction du vacarme des alertes : Vous pouvez réduire la déferlante d'alertes bruyantes et prioriser les problèmes plus facilement en groupant les alertes et les événements provenant de n'importe quelle source en un seul problème corrélé sur lequel vous pouvez immédiatement agir.
  • La découverte rapide de la cause profonde du problème : Vous pourrez éliminer les hypothèses approximatives et résoudre les problèmes plus rapidement grâce aux informations automatiques sur la cause profonde probable de chaque problème.
  • Une réponse plus rapide en cas d'incident : Vous pouvez intégrer New Relic Applied Intelligence avec les outils ITSM et éliminer les tâches de gestion des incidents sur tous les outils en les synchronisant tous.

Regardons de plus près les nouveautés et les solutions déjà disponibles dans Applied Intelligence.

Détection immédiate des changements

Détection continue et automatique des anomalies - disponible sans frais supplémentaires

anomaly detection example screenshot

Applied Intelligence détecte automatiquement les anomalies en fonction des signaux dorés tels que le débit, les erreurs et la latence sur toutes les applications et tous les services. Tout cela est désormais activé automatiquement et sans configuration requise pour tous les services et applications instrumentés. Et en plus, c'est gratuit. Quand des anomalies sont détectées, vous recevez une notification immédiate via Slack ou d'autres outils de collaboration, et un flux en temps réel de chaque anomalie et des analyses approfondies vous permettent d'y répondre plus rapidement et d'empêcher tout problème potentiel d'atteindre les clients.

Video

 

Log Patterns

log patterns beta overview

Applied Intelligence inclut une nouvelle fonctionnalité qui utilise l'apprentissage machine (ML) pour détecter les schémas et faire remonter à la surface les aberrances dans vos données de logs, ce qui vous permet de réduire les temps de dépannage. Explorez en un clic des millions de messages de logs et réduisez les interrogations manuelles grâce au regroupement automatique des données de logs avec Log Patterns, qui vous aide à rapidement trouver les schémas anormaux et les problématiques aiguilles dans la botte de foin. La version bêta de Log Patterns est actuellement disponible. Si vous souhaitez l'activer pour votre compte New Relic, contactez la personne chargée de votre compte client.

 

Alerts Analytics

alert analytics

Une nouvelle page d'accueil intégrée met en relief les informations et les analyses sur la performance des configurations de vos alertes.

Règles de mise en sourdine des alertes récurrentes

alerts recurring muting rules

Définissez des calendriers récurrents pour mettre en sourdine des règles New Relic Alerts afin d'avoir plus de contrôle sur la suppression des alertes durant les périodes de maintenance ou d'indisponibilité prévues. Définissez également des calendriers récurrents quotidiens, hebdomadaires, ou mensuels pour mettre en sourdine des règles via l'interface New Relic UI ou API.

Réduisez le vacarme des alertes

Video

 

Une corrélation basée sur les relations

relationship based correlation

Vous pouvez désormais corréler les alertes et les événements connexes en fonction des données relationnelles externes de la base de données de gestion des configurations (CMDB) et des relations des entités New Relic. Outre la corrélation des alertes à l'aide du regroupement temporel et de la contextualisation à partir des messages d'alerte, vous pouvez désormais ingérer les données de topologie à partir de vos datastores relationnels (CMDB) et activer ainsi une corrélation plus précise des alertes provenant des services connectés. Ceci contextualise mieux les incidents qui se produisent et la façon dont ils impactent votre environnement global, et vous permet de prioriser les problèmes de manière plus précise et efficace.

Anomalies dans des problèmes corrélés

alert noise reduction

Vous pouvez corréler proactivement les anomalies détectées en même temps que les alertes et les événements de n'importe quelle source afin d'obtenir un portrait détaillé du problème à gérer, ce qui réduit le temps nécessaire pour comprendre la situation et agir.

Créez des décisions de corrélation plus rapidement avec Correlation Assistant

correlation assistant

Une corrélation qui aurait dû se produire n'a pas eu lieu ? Vous avez une idée de comment réaliser une corrélation, mais vous n'êtes pas sûr de savoir par où commencer ? Avec la nouvelle fonctionnalité Correlation Assistant, vous pouvez simplement vous lancer en sélectionnant les incidents qui auraient dû être corrélés, puis laisser New Relic les analyser pour vous montrer ce qu'ils ont en commun. Ainsi, vous avez un plus grand contrôle sur la manière de réduire le bruit des alertes.

En outre, Applied Intelligence est assez intelligent pour simuler votre configuration et vous montrer en temps réel comment la corrélation des incidents peut réduire le bruit des alertes et améliorer le contexte à l'avenir.

Trouvez la cause profonde du problème rapidement

Visualisez la ou les causes profondes probables de chaque problème

root cause analysis example screenshot

Applied Intelligence vous apporte automatiquement des informations sur les causes probables de chaque problème que vous rencontrez. Vous pouvez rapidement voir pourquoi chaque problème irrésolu s'est produit, quels sont les déploiements qui y ont contribué, avec aussi les logs d'erreurs et les attributs pertinents pour vous aider à examiner le problème plus rapidement que jamais. Applied Intelligence analyse la distribution de chaque attribut dans les données ingérées et fait remonter à la surface les causes possibles en détectant les changements importants dans la distribution. Par exemple, pour chaque événement de transaction généré, vous pouvez déterminer si un seul utilisateur commence à prendre une plus grande part des requêtes envoyées à votre application.

L'analyse des causes profondes classe aussi automatiquement les problèmes en fonction des signaux dorés (tels que les erreurs, le trafic, la latence, et la saturation) pour que vous puissiez rapidement vous trouver vos marques et savoir pourquoi le problème s'est produit.

Video

 

Comprenez l'impact et l'étendue de chaque problème

Vous pouvez voir quelles sont les entités (hôtes, conteneurs, applications) affectées pour rapidement et précisément évaluer l'étendue du problème et déterminer ce qu'il faut faire pour y remédier. Vous pouvez isoler la source du problème grâce aux informations automatiques qui indiquent quel est l'impact de chaque problème sur les services et les composants de votre environnement.

Résolvez les incidents plus rapidement

Intégration bidirectionnelle avec ServiceNow pour les problèmes corrélés

servicenow integration

PagerDuty vient s'ajouter à notre intégration bidirectionnelle existante, vous pouvez désormais éliminer le labeur de la gestion des incidents sur tous les outils en synchronisant de manière bidirectionnelle l'état des problèmes corrélés dans Applied Intelligence avec les incidents ServiceNow. Au fur et mesure que l'état de chaque problème corrélé change dans l'une des deux plateformes, il est désormais automatiquement mis à jour dans les deux outils. Applied Intelligence prend également en charge un webhook pour une intégration avec VictorOps, OpsGenie, et d'autres outils de votre choix.

Recommandations d'intervenants pour les infractions New Relic Alerts

suggested responders

Recevez automatiquement des recommandations sur les membres de votre équipe qui sont les mieux armés pour intervenir sur un problème, soit parce qu'il s'agit d'experts en la matière, soit parce qu'ils ont résolu des problèmes similaires auparavant. Cette amélioration s'appuie sur l'assistance que nous fournissons déjà et qui recommande des intervenants sur les incidents PagerDuty, en suggérant des membres de l'équipe en fonction des problèmes provenant des infractions New Relic Alerts. Et cerise sur le gâteau, cette fonctionnalité est complètement automatique et ne requiert aucune configuration ni formation sur le modèle. Elle est immédiatement prête à l'emploi pendant que New Relic tire des leçons des comportements des intervenants de votre équipe.

Comment vous lancer ?

Tous les clients de New Relic Applied Intelligence ont accès aux nouvelles fonctionnalités sans frais supplémentaires.

Si vous êtes intéressé par l'ajout de fonctionnalités AIOps à votre implémentation New Relic, vous pouvez vous lancer immédiatement en cliquant sur le lien « Alertes et AI » dans votre compte New Relic.

Et si vous débutez avec New Relic, mais que vous souhaitez avancer un peu plus, découvrez la simplicité de New Relic One de vous-même en vous inscrivant pour obtenir un compte gratuit, pour toujours, et découvrez New Relic Applied Intelligence.