Sportradar conforte son open source et sa culture DevOps avec l'observabilité

Région
Défis commerciaux

Des courses de Formule 1 au Championnat du monde de snooker, du base-ball américain au football européen en passant par plusieurs dizaines d'autres sports : l'expérience des supporters ne serait pas la même sans Sportradar.

En tant que leader mondial en matière d'intelligence et de technologie des données sportives, Sportradar réalise le monitoring et livre des informations provenant de plus de 400 000 matchs par an dans plus de 60 catégories sportives. La société est le partenaire officiel de la NBA, la NHL et NASCAR, mais aussi de la FIFA et de l'UEFA, et elle est le seul fournisseur de confiance qui collabore avec les ligues de sport américaines dans le cadre de fonctions officielles de distribution mondiale des données sportives (NBA et NHL) pour les paris. En outre, les produits et services de paris sportifs, de spectacles et d'intégrité de Sportradar sont utilisés par plus de 1 000 entreprises dans 80 pays.

« Notre technologie est derrière toutes les principales fédérations et organisations sportives du monde. Nous sommes avant tout une organisation de développement de logiciels qui adopte la fine pointe de la technologie telle que l'intelligence artificielle et la vision par ordinateur pour livrer les meilleurs produits et technologie de sports possible. » -Scott Dunbar, Directeur mondial de l'ingénierie DevOps, Sportradar

200
services voient leur santé/intégrité couverte dans les dashboards
99,9 %
des objectifs SLO de disponibilité atteints sur tous les services
15 %
d'augmentation de la fréquence des sorties de versions

New Relic nous a aidés à modifier la façon dont nous comprenons les performances et testons nos systèmes. Avec la mutation de notre culture et New Relic comme composante intégrale du pipeline de livraison pour tester les changements, nous avons un portail de qualité qui nous permet d'attraper les problèmes avant de les expédier en production.

De l'expertise en silo aux équipes collaboratives plurifonctionnelles

Lorsque Scott Dunbar et le directeur de la technologie de Sportradar, Ben Burdsall, ont rejoint la société, chaque équipe d'ingénierie travaillait complètement indépendamment des autres. « C'était la plus grosse start‑up que j'avais jamais vue, avec des équipes en silo complètement séparées les unes des autres. Nous avions des poches d'excellence, mais il y avait très peu de partage, de collaboration, ou d'alignement entre les équipes, » confie Scott Dunbar.

La vision de Ben Burdsall était de transformer l'organisation du groupe d'ingénieurs en suivant le modèle « Spotify » de déploiement d'Agile à grande échelle. Comme l'explique Scott Dunbar : « Nous avons commencé par créer ce que nous appelons le modèle « Spotify », dans lequel la capacité des ingénieurs est organisée en tribus, squads, chapitres et guildes. L'objectif est d'activer des équipes plurifonctionnelles, de créer la transparence autour des rôles et des responsabilités, et de positionner la fonction d'ingénierie autour d'une stratégie claire ».

Aujourd'hui, cette vision a été atteinte avec plus de 500 ingénieurs organisés en 17 tribus. Chaque tribu est composée d'une équipe d'ingénieurs focalisée sur un portefeuille de produits. Des spécialistes DevOps sont placés dans les tribus et les squads pour compléter les équipes plurifonctionnelles. Scott Dunbar explique : « En tant qu'ingénieurs DevOps, nous nous concentrons sur le défi de l'observabilité tout au long du cycle de livraison des logiciels. Nous définissons l'observabilité comme étant la création d'un système où nous pouvons déboguer les inconnues « inconnues ». Notre équipe injecte ces compétences et cette passion pour l'utilisation des données afin de comprendre l'état de santé des applications qui sont au cœur de nos tribus. »

Des équipes autonomes et une seule stratégie d'observabilité

Parmi les importants principes d'ingénierie qui sont restés dans la nouvelle structure organisationnelle de la société, on trouve l'autonomie des équipes. Selon Scott Dunbar : « nous croyons que nos squads et tribus doivent être libres de choisir la technologie ou les outils avec lesquels elles sont à l'aise et qui d'après elles répondent le mieux à leurs besoins. Pour cela, nous avons mis en place une couche de gouvernance et d'alignement qui leur permet de garder leur autonomie tout en garantissant la cohérence au niveau de la formulation des métriques clés. Et bien évidemment, New Relic joue un rôle capital et nous aide à y arriver. »

Lorsque Scott Dunbar a rejoint Sportradar, il a découvert que les équipes utilisaient un large éventail d'outils et d'approches de monitoring divers pour comprendre la santé du système : « Il y avait très peu de cohérence et une adoption rare de métriques au niveau des services, d'indicateurs de performance clés ou de mesure des indicateurs de niveau de service pour atteindre l'objectif de niveau de service. »

Grâce à New Relic, les équipes peuvent vraiment devenir autonomes tout en faisant le suivi et en générant des rapports sur un ensemble de métriques logiques. L'entreprise bénéficie ainsi d'une vue complète du portefeuille complexe de ses produits et services. « La flexibilité de New Relic et sa prise en charge de l'open source signifient que nos équipes peuvent continuer à utiliser les outils d'OpenTelemetry qu'elles connaissent et apprécient tout en faisant remonter à la surface les métriques clés en un seul et même endroit. Nous avons désormais une vue cohérente de l'état de santé de nos services sur notre domaine qui compte plus de 200 services aux entreprises. »

Le suivi des métriques clés pour booster les SLA

Pour chaque service technique, Sportradar attend de ses équipes qu'elles capturent les métriques de disponibilité, fiabilité et performance pour pouvoir les comparer à un objectif de niveau de service (SLO). « Nous transformons ensuite les services techniques en service aux entreprises, nous comparons les indicateurs de niveau de service (SLI) contre nos SLO, puis nous guidons l'activité en fonction des accords de niveau de service (SLA) fiables pour le service aux entreprises particulier. Nous assurons la livraison contre le SLO de disponibilité 99,9 % du temps pour tous nos services aux entreprises. »

La programmabilité dans New Relic donne à Scott Dunbar et aux équipes d'ingénierie la capacité de personnaliser les méthodes de suivi et de calcul des métriques. Pour lui, « il était essentiel de transformer les informations importantes obtenues en temps de disponibilité déterminé par la durée d'une condition spécifique dans le service technique. Nous avons créé une application d'observabilité personnalisée dans New Relic qui tire les données du monitoring synthétique et des processus de New Relic pour obtenir une vue complète des temps de disponibilité de chaque système. »

La flexibilité de New Relic et sa prise en charge de l'open source signifient que nos équipes peuvent continuer à utiliser les outils d'OpenTelemetry qu'elles connaissent et apprécient tout en faisant remonter à la surface les métriques clés en un seul et même endroit. Nous avons désormais une vue cohérente de l'état de santé de nos services sur notre domaine qui compte plus de 200 services aux entreprises.

Une sortie plus rapide des versions et des latences clairement comprises

New Relic a également aidé l'organisation de l'ingénierie à mesurer et améliorer la qualité des versions tout en augmentant de 15 % leur fréquence de sortie Scott Dunbar reconnaît que « New Relic nous a aidés à modifier la façon dont nous comprenons les performances et testons nos systèmes. Avec la mutation de notre culture et New Relic comme composante intégrale du pipeline de livraison pour tester les changements, nous avons un portail de qualité qui nous permet d'attraper les problèmes avant de les expédier en production. »

Pour Sportradar, l'échange de données à faible latence entre tous les systèmes interconnectés de notre énorme réseau est un impératif. New Relic est essentiel pour aider notre entreprise à comprendre et à améliorer la latence des données en utilisant le tracing distribué. « Nous collectons des millions de points de données à partir de milliers de sources de données dans ce que j'appelle la tête du serpent. C'est dans la longue queue du serpent que se trouve une multitude de services, tels que les calculs des cotes ou contre le trucage de matchs, qui consomment les données. »

Toujours selon Scott Dunbar : « La prise en charge d'OpenTelemetry par New Relic et les API riches en fonctionnalité sont ce qui nous permet d'utiliser le tracing distribué pour comprendre les latences et le temps d'ingestion des sources de données, dans la tête du serpent, et jusqu'au bout de la queue. Je ne pense pas qu'il n'y ait aucun autre outil capable de s'adapter à la diversité des produits et services de notre portefeuille qui pourrait également faire remonter une trace, de la racine du span jusqu'à tous les consommateurs de ce point de données. »

Sportradar a réussi le passage des équipes en silos au modèle Spotify de capacité d'ingénierie. Une couche de gouvernance a été intégrée pour aligner les équipes autour de stratégies de technologie et d'observabilité centrales.

« Notre ingénierie comprend des équipes vraiment multifonctionnelles, avec des squads complètement autonomes qui créent de super produits et services sans dépendre de personnes externes à la squad ou à la tribu. Le modèle fonctionne bien et nous avons atteint nos objectifs. New Relic est une composante intégrale de notre réussite. »

Scott Dunbar continue en se projetant vers l'avenir. Il prévoit que l'organisation va continuer à gagner en maturité dans tout ce qu'elle accomplit et à améliorer davantage son observabilité : « Je suis particulièrement curieux de la façon dont nous pourrions tirer encore plus parti des avantages de New Relic pour obtenir des informations détaillées sur l'agrégation des logs et l'utilisation encore plus poussée des capacités d'OpenTelemetry pour le tracing distribué. »