Une étude New Relic révèle que le coût des pannes informatiques peut atteindre jusqu'à 1,9 million d'USD de l'heure
Les conclusions provenant de 1 700 professionnels du secteur des technologies dans 16 pays révèlent un temps d’arrêt moyen annuel des pannes à fort impact de 77 heures et que les équipes d'ingénierie passent 30 % du temps à gérer les interruptions.
New Relic, la société à la plateforme d’observabilité intelligente, a publié Prévisions 2024 sur l'observabilité, le rapport le plus complet du secteur sur l'état de l'observabilité. L'enquête menée auprès de plus de 1 700 professionnels du secteur des technologies dans 16 pays a permis de mettre en évidence dans le rapport les zones de croissance, les défis rencontrés et les tendances externes qui influencent les investissements en observabilité. Les données révèlent une moyenne annuelle de 77 heures de temps d’arrêt pour les pannes à fort impact, pour un coût pouvant atteindre jusqu'à 1,9 million d'USD de l'heure. Les conclusions indiquent une forte corrélation entre l'observabilité full-stack et la réduction des temps d’arrêt, la baisse du nombre d'interruptions et l'allégement des coûts annuels dus aux pannes — ce qui renforce le rôle critique que joue l'observabilité en optimisant l'efficacité opérationnelle et les performances commerciales.
Les pannes augmentent les temps d'arrêt et la perte de revenu
Selon l'enquête, les équipes d'ingénierie passent 30 % de leur temps à gérer les interruptions — ce qui équivaut à 12 heures par semaine standard de 40 heures. Les principales causes de pannes imprévues au cours des deux dernières années comprennent les pannes de réseau (35 %), les pannes des prestataires de services tiers ou cloud (29 %) et les erreurs humaines (28 %).
Le rapport met en évidence que les pratiques d'observabilité peuvent nettement réduire les temps d’arrêt. Les pratiques clés qui ont aidé à réduire les temps d’arrêt comprennent les analyses la cause profonde et les revues post-incident (37 %), le monitoring des métriques DORA (34%), le suivi des signaux dorés (latence, trafic, erreurs et saturation) (33 %) et la gestion du temps moyen de détection et de résolution (MTTx) des pannes (33 %).
L'IA et la sécurité stimulent les investissements en observabilité
L'intelligence artificielle (IA) et la sécurité stimulent le besoin croissant d'observabilité, avec 41 % des participants citant comme tendance clé l'adoption de l'IA et l'attention accrue sur la sécurité, la gouvernance, les risques et la conformité. La capacité la plus déployée était le monitoring de la sécurité (58%), suivi du monitoring de l'IA (42 %), du monitoring des modèles d'apprentissage machine (ML) (29 %), et de l'AIOps (24 %). En outre, 39 % prévoient le déploiement de l'AIOps au cours de l'année prochaine, alors que 36 % prévoient l'implémentation du monitoring de l'IA et 34 % d'ajouter le monitoring des modèles ML.
Les organisations qui déploient ces capacités d'observabilité optimisées par l'IA ont vu leur valeur annuelle augmentée grâce à l'observabilité et un retour sur investissement (RSI) plus robuste.
L'observabilité full-stack réduit nettement les temps d’arrêt
Le rapport montre que l'observabilité full-stack peut réduire drastiquement l'impact des pannes. En moyenne, les organisations qui disposent de l'observabilité full-stack ont vu une baisse de 79 % des temps d’arrêt (soit 70 heures contre 338 heures par an), ce qui leur a permis d'économiser 42 millions d'USD, et une baisse de 48 % des coûts dus aux pannes (soit 1,1 million d'USD contre 2,1 millions) par rapport à celles qui ne l'ont pas. Elles ont également vu leurs dépenses en observabilité baisser de 27 % et une détection des interruptions de 51 % plus précoces. Une association plus forte existe entre le déploiement de plus de capacités d'observabilité et moins de temps d’arrêt, moins de temps de gestion des interruptions et des coûts de pannes annuelles plus bas.
« Le rapport Prévisions sur l'observabilité de cette année montre les avantages réels de l'implémentation de l'observabilité full-stack et métier. Les entreprises qui adoptent ces pratiques ont moins de temps d'arrêt, moins de pannes critiques et un RSI plus élevé. - Nic Benders, Stratégiste en technologie principal chez New Relic
Parmi les autres constatations clés du rapport, on notera :
- Le quadruplement du retour sur les investissements en observabilité. Les dépenses annuelles moyennes sur l'observabilité étaient de 1,95 million d'USD, alors que la valeur annuelle moyenne reçue était de 8,15 millions d'USD — soit 4 fois le RSI (295 %). Les organisations qui ont déployé au moins cinq capacités d'observabilité ont indiqué une valeur plus élevée et un meilleur RSI en observabilité que celles qui n'en déployaient que quatre ou moins.
- Le passage à des plateformes consolidées. Une préférence de 2 contre 1 s'est dégagée en faveur d'une plateforme unique et consolidée plutôt que de plusieurs solutions ponctuelles. Le nombre de participants utilisant un seul outil a augmenté de 37 % d'une année sur l'autre, alors que le nombre moyen d'outils baissait de 11 %. En outre, 41 % d'entre eux prévoyaient de consolider leurs outils au cours de l'année prochaine.
L'open source est utilisé, mais n'est pas standard. Plus de la moitié des participants (51 %) utilisaient une solution open source pour au moins une capacité d'observabilité, mais seulement 1 % utilisaient uniquement l'open source. Les utilisations les plus courantes de l'observabilité open source comprennent le monitoring de l'IA (31 %), le monitoring synthétique (28 %), le tracing distribué (28 %), et les capacités AIOps (26 %).
- L'observabilité métier est à la hausse. La corrélation des résultats de l’entreprise avec les données télémétriques (l'observabilité métier) était une importante priorité pour les professionnels en technologie de l'information, et 40 % d'entre eux qui la déployaient déjà et 47 % qui prévoyaient de la faire au cours des trois prochaines années. Les organisations qui avaient mis en place l'observabilité métier constataient une baisse de 40 % des temps d’arrêt annuels, une réduction de 24 % du coût horaire des pannes, et une diminution 25 % du temps de gestion des interruptions par rapport à celles qui ne l'avaient pas implémentée.
Le rapport Prévisions 2024 sur l'observabilité est disponible dès aujourd'hui. Lire le rapport complet.
Méthodologie de l'étude
New Relic et ETR ont enquêté auprès de 1 700 professionnels des technologies dans 16 pays des Amériques, d'Asie Pacifique et d'Europe. Parmi tous les participants, 65 % d'entre eux étaient des utilisateurs quotidiens de l'observabilité (développeurs et ingénieurs) et 35 % étaient des décisionnaires en technologie de l'information (cadres supérieurs et responsables non‑cadres). L'enquête a été menée en avril et mai 2024 par le cabinet de recherche ETR.
À propos de New Relic
Après avoir inventé le monitoring des performances des applications (APM), New Relic se trouve sur le devant de la scène de l'observabilité avec la plateforme la plus avancée qui soit pour l'élimination des interruptions numériques. Des entreprises du monde entier — dont adidas Runtastic, la Croix-Rouge américaine, Domino’s, GoTo Group, Ryanair, Topgolf, et William Hill — tournent sur New Relic pour créer de meilleures expériences numériques, optimiser leur chiffre d'affaires et être à la pointe de l'innovation.www.newrelic.com.