De nos jours, la philosophie des entreprises de toutes tailles est de « numériser et moderniser. » Peu d’organisations sont cependant capables d’émuler la transformation numérique que le géant de l’édition et de l’analyse néerlandais, Elsevier, a menée à bien.

Fondée à Rotterdam en 1880, Elsevier a commencé comme petit éditeur dédié à la diffusion des connaissances et du divertissement dans la société néerlandaise. Progressivement, Elsevier est passée d’une firme traditionnelle produisant du texte et des images statiques à la production d’informations techniques pour aider le monde scientifique et de la santé à prendre de bonnes décisions dans tous les aspects de leurs activités. 

Cette transformation a vu les activités d’édition d’Elsevier (plus de 470 000 articles publiés dans 2 500 journaux par an) évoluer vers les eBooks et le journalisme en ligne. Plus récemment, l’entreprise a développé des solutions d’analyse et des outils numériques (ainsi que des plateformes Big Data) utilisés par la recherche médicale et scientifique (en l’accélérant et en réduisant ses coûts).  

En d’autres termes, Elsevier est devenue une entreprise technologique. En 2013, lorsque Matt Reid a rejoint la société en tant que responsable de l’infrastructure et des opérations, elle était devenue une véritable entreprise technologique confrontée à des défis considérables.

Des livres aux données, et des données au cloud

Selon Reid, « Elsevier a commencé par vendre des livres (elle en vend d’ailleurs toujours, pour un chiffre d’affaires de 300 millions de dollars par an), mais aujourd’hui elle met à disposition toutes les données contenues dans ces volumes (entre autres) dans un format électronique. Cette nouvelle stratégie repose cependant sur une façon différente de faire les choses, ce qui n’était pas possible dans notre empreinte technologique existante. Nous étions assis au milieu d’un data center, sans l’agilité nécessaire. Et nous n’avions pas les bonnes personnes. Nos fonctions de support étaient sous-traitées à des tiers. »

En 2013, lorsque le directeur technique d’Elsevier, Dan Olley, a chargé le groupe de Reid d’éliminer ces contraintes et de changer la façon dont l’entreprise livrait sa technologie, Reid et son équipe se sont vite tournés vers le cloud pour son agilité, sa souplesse et la réduction des coûts qu’il permettait.

Éliminer le bruit blanc

Quatre ans plus tard, Elsevier avait migré presque tout son environnement vers le cloud AWS, notamment 12 000 serveurs et plus de 400 produits. Les avantages du cloud s’accompagnaient de nouveaux défis, en particulier celui de pouvoir bénéficier d’une vue unique sur les performances de ce nouvel environnement dynamique.

« En 2016 et 2017, nous en étions au milieu de notre migration cloud et nous avions donné à nos collaborateurs un niveau d’autonomie élevé lors de cette opération, explique Reid. En fait, nous avions beaucoup de gens très intelligents qui avaient leurs préférences pour des tas d’outils différents. »

Cet ensemble d’outils disparates avait créé de nouveaux problèmes, car ces nombreux produits de surveillance étaient configurés différemment, ce qui produisait des résultats incohérents. « En particulier, explique Reid, notre surveillance d’infrastructure générait beaucoup de bruit blanc, chaque outil envoyait des alertes dans tous les sens. »

Il était clair qu’il fallait changer d’outil. Elsevier s’est alors tournée vers New Relic.

Définir des objectifs

« Nous avions trois objectifs principaux, explique Reid. Comprendre nos coûts, comprendre les performances et la fiabilité de nos produits, et passer à un modèle de développement DevOps. L’argumentation de New Relic nous a plu, car elle nous a montré que nous pouvions non seulement aligner leur produit avec notre technologie, mais aussi utiliser leurs outils de surveillance pour faciliter une approche DevOps et bénéficier d’informations exploitables dont nous avions absolument besoin pour la fiabilité et la disponibilité de nos produits. »

Bénéficier d’une vision large et d’informations exploitables

L’équipe Elsevier n’a pas mis longtemps pour décider que la plateforme New Relic serait intégrée au modèle d’exploitation de l’organisation. Le premier produit New Relic que l’entreprise déploya fut New Relic Infrastructure.

Reid continue : « Beaucoup de gens nous ont demandé pourquoi nous n’avions pas déployé New Relic APM en premier. La réponse ? Nous savions que New Relic Infrastructure était plus intéressant, car il répondait à un besoin immédiat. Après avoir déployé Infrastructure, nous avons pu réduire le bruit blanc et récupérer notre efficacité d’exploitation en créant des configurations standards, en exploitant une instrumentation standard et en standardisant le reporting dans toutes les équipes. » 

De plus, en déployant New Relic Infrastructure dans tout son environnement, Elsevier bénéficie d’informations exploitables sur les coûts et l’utilisation. 

« Un des problèmes auquel nous avons dû faire face par le passé était le manque de compréhension de l’utilisation de nos environnements hors production versus ceux de production, explique Reid. Nous avions beaucoup de mal à savoir si les versions installées sur nos environnements hors production avaient un impact sur nos environnements de production. En déployant Infrastructure à tous les niveaux, nous avons pu visualiser et comprendre l’impact des modifications avant qu’une nouvelle version passe en production. De plus, Infrastructure nous a fourni les informations nécessaires pour supprimer six ou sept contrats. »

Passer à un avenir DevOps

Tout en déployant Infrastructure, Elsevier a repensé ses outils existants pour la surveillance des utilisateurs au sein de New Relic Synthetics, et a déployé New Relic APM dans tout l’environnement Elsevier.

« La surveillance New Relic a permis à nos développeurs de voir les performances de leurs applications du point de vue de l’infrastructure, des utilisateurs et au sein même des applications, explique Reid. Un développeur et un ingénieur SysOps peuvent de fait travailler côte à côte et diagnostiquer et catégoriser un incident. Cela n’était tout simplement pas possible auparavant. » 

« La surveillance New Relic a permis à nos développeurs de voir les performances de leurs applications au niveau de l’infrastructure, des utilisateurs et au sein même des applications. Un développeur et un ingénieur SysOps peuvent de fait travailler côte à côte et diagnostiquer et catégoriser un incident. » 

— Matt Reid, responsable de l’infrastructure et des opérations, Elsevier

C’est ce genre de changement qui permet à Elsevier de réaliser son objectif de passage à un modèle DevOps de développement et de livraison continus. Reid continue : « Nous changeons notre façon de travailler pour devenir plus agile en tant qu’organisation, et New Relic a été le catalyseur de notre initiative. Grâce à New Relic, nous disposons désormais d’une unité de développement pour chacun de nos produits, et ces unités incluent des ingénieurs DevOps se concentrant en même temps sur le développement et les opérations. »

Comprendre l’expérience client numérique

Au-delà de la surveillance des applications et de l’infrastructure, la plateforme New Relic aide Elsevier à mieux comprendre comment les utilisateurs emploient ses produits numériques.

Prenez Reaxys, l’application de recherche en chimie proposée par Elsevier, utilisée par des chercheurs, des étudiants et des sociétés pharmaceutiques dans le monde entier pour répondre aux questions liées à la chimie. Lorsqu’arriva le moment de migrer l’application vers le cloud AWS, l’entreprise a dû actualiser l’interface utilisateur et refondre le front-end en une application monopage. 

Jonathan Snow, responsable de l’engineering logiciel de Reaxys, a rejoint Elsevier deux semaines avant la date de mise en service de l’application cloud native ; quelle ne fut pas sa surprise lorsqu’il découvrit que personne ne savait vraiment à quoi s’attendre en mode production, et n’avait aucune vision globale du fonctionnement. En s’appuyant sur le contrat existant de Elsevier avec New Relic (et en exploitant sa propre expérience de la plateforme), il déploya rapidement New Relic Browser et APM.

Avec la plateforme New Relic en place, Snow et son équipe ont bénéficié immédiatement de la vision globale dont ils avaient besoin, mais il leur fallait aller plus loin pour comprendre la lenteur de chargement des pages, qui menaçait la fidélité des clients, sans parler de leur mauvais score NPS.

Obtenir une vue globale

Lorsqu’il est apparu que les clients chinois étaient confrontés à des temps de chargement de l’application anormalement longs, Snow et son équipe ont mis Synthetics au travail. « Dans New Relic, nous pouvions voir que les temps de chargement s’établissaient à 12,5 secondes (déjà pas très bons), mais qu’en Chine on atteignait jusqu’à 35 secondes ! Nous avons réussi à réduire ces temps de chargement dans les autres pays, mais en Chine on dépassait encore les 8 secondes. En déployant Synthetics, nous avons enfin pu découvrir qu’il s’agissait d’un problème au niveau du réseau (perte de paquets et empoisonnement DNS). Les temps de chargement en Chine sont désormais d’environ 1,2 seconde. » 

Il n’est pas surprenant que Snow soit un fan de Synthetics : « Ce que j’adore avec Synthetics c’est qu’il nous fournit une vue contrôlée et reproductible des performances de notre application dans le monde entier, sans quitter l’écosystème unique des outils New Relic. »

Avantages

Pour Reid, New Relic a pour principal avantage de fournir une vue complète des performances au niveau du système, ainsi que la démocratisation qui l’accompagne. 

« Par le passé, raconte Reid, on m’appelait à 3 heures du matin pour un problème. L’ingénieur développement me disait que l’application fonctionnait parfaitement, l’ingénieur réseau me disait que le réseau fonctionnait bien et l’ingénieur infrastructure m’affirmait qu’il n’y avait aucun problème d’utilisation. Et pourtant, il y avait bien un problème. Le souci, c’est que les trois ingénieurs ne s’occupaient que de leur domaine spécifique. Avec New Relic, je peux réunir les trois ingénieurs à 3 heures du matin et ils voient tous la même chose : produit, services et réseau, avec toutes les données d’utilisation, de performances et de fiabilité. C’est comme cela que nous avons pu réaliser notre transformation et passer progressivement à ce modèle DevOps. »

Cela a également permis à l’entreprise de réduire de manière significative les délais de résolution des pannes, d’améliorer les performances de l’application, de l’infrastructure et du site Web, tout en réduisant les coûts. Snow explique : « Aujourd’hui, nos équipes de développement peuvent voir immédiatement l’impact de leurs modifications dans les environnements de production et hors production, ce qui nous évite de perdre des heures à passer d’un composant à un autre pour identifier la cause première des incidents. » 

Avec le temps gagné, les développeurs peuvent se consacrer pleinement aux tâches de développement, les équipes produits à leurs produits, etc. Par conséquent, les performances s’améliorent (notamment avec le bond en avant des temps de chargement des pages au niveau mondial) et les coûts baissent (grâce à un personnel plus productif et un jeu d’outils consolidé). Et bien sûr, les clients sont ravis !

« Après avoir utilisé Synthetics et Insights pour examiner en détail nos données, nous sommes passés d’une situation où des clients en Chine menaçaient d’annuler ou de réduire leurs contrats à des renouvellements, explique Snow. Nous sommes arrivés au point où nous élargissons notre clientèle. C’est une transformation remarquable, due largement aux informations fournies par New Relic. »

« Après avoir utilisé Synthetics et Insights pour examiner en détail nos données, nous sommes passés d’une situation où des clients en Chine menaçaient d’annuler ou de réduire leurs contrats à des renouvellements. »

— Jonathan Snow, responsable de l’ingénierie logicielle pour Reaxys, Elsevier

L’avenir

À mesure qu’Elsevier continue sa modernisation, Reid s’attend à profiter encore plus de New Relic. L’organisation a déjà économisé plusieurs centaines de milliers de dollars en réduction des coûts simplement en réduisant le nombre d’outils de surveillance et en éliminant le bruit blanc qui, par le passé, empêchait d’identifier les problèmes et de les résoudre rapidement. Et il est optimiste pour l’avenir.

« Ce qui me plaît, continue Reid, c’est que nous commençons à aligner nos équipes commerciales et techniques, et que nous avons une vision claire de la façon dont nous pouvons améliorer l’expérience client numérique, enrichir nos produits et services, et créer une interaction positive entre les équipes, grâce à New Relic. »