Sensing Clues est une ONG hollandaise qui travaille en partenariat avec des organisations pour présenter les meilleures technologies du secteur et transformer les espaces sauvages en refuge pour la faune et les gens. Dans le monde des organisations à but non lucratif, la budgétisation des nouvelles technologies est extrêmement importante. Le temps est également très important, surtout dans une si petite équipe basée sur le bénévolat. Pour nous aider à gérer les deux, il nous fallait en savoir plus sur ce qui se passait dans notre stack technologique avec un accès facile aux données importantes et la capacité de configurer les alertes pour éviter les bruits inutiles. 

Au début, lorsqu'il se passait quelque chose dans notre stack technologique, nous recevions généralement un appel de nos utilisateurs. Ça allait parce que nous étions dans la phase pilote. C'était gérable. Mais nous avons eu plus de clients et nous avons dû évoluer, et ce n'était plus une option. Si nos outils ne fonctionnent pas, nos clients sur le terrain ont de vrais problèmes. Pour obtenir ce type d'alerte sur les problèmes de manière proactive et empêcher qu'ils se produisent, nous avons commencé à faire des recherches sur les solutions de monitoring. Nous voulions une solution logicielle qui pouvait nous aider à interroger, visualiser et analyser les données. Avant New Relic, nous ne connaissions pas l'état des logiciels ni de la plateforme. 

La plateforme Sensing Clues est composée de plusieurs applications alimentant l'application mobile « de terrain », Cluey, soutenue par MarkLogic, Nginx, NextCloud, et Keycloak. L'application aide les utilisateurs à gérer l'état de la zone, par exemple, pour enregistrer les observations de la faune ou l'état des actifs d'un parc. Nous voulions utiliser le tracing distribué — il suit et observe des demandes de service à mesure qu'elles passent dans les systèmes distribués — pour voir le parcours de l'utilisateur au sein de notre application. Avec cela, nous pouvions également vérifier que les agents corrects fonctionnaient et limiter toutes les données non pertinentes ingérées dont nous n'avions pas besoin, en plus des tests synthétiques qui aident à valider proactivement les informations utilisateurs.

Le cycle d'informations intégral compris sur la plateforme Sensing Clues.

Paramétrage d'alertes simples et puissantes

L'une des premières tâches que nous avons accomplies avec New Relic a été le paramétrage des alertes. C'était un petit effort qui a fait une énorme différence. Nous n'utilisons pas beaucoup les mails et donc l'intégration à Slack est parfaite. Nous avons deux canaux Slack dédiés aux alertes. Le premier nous indique s'il y a une défaillance, ce qui fait que nous n'avons pas besoin de surveiller constamment ce qui se passe. Dès qu'il y a un échec, une alerte se déclenche. Notre second canal est dédié aux anomalies. Un exemple d'anomalie peut être une augmentation ou une baisse soudaine du trafic. En tant que gestionnaire des opérations, je suis généralement celle qui surveille les deux canaux. Si c'est une urgence, nous organisons un appel avec l'équipe. Nous avons également un groupe WhatsApp pour toutes les urgences technologiques réelles. Nous n'avons pas eu à l'utiliser depuis plus d'un an en raison du nouveau système d'alerte en place.

Visualisation des performances de l'infrastructure grâce aux dashboards

Les dashboards nous donnent un aperçu des environnements dans lesquels nous travaillons, y compris celui des utilisateurs qui interagissent avec notre application. Nous avons un environnement de production et de test, et un autre pour les projets de science des données couverts par le biais des dashboards. Cela nous aide à solutionner tout problème de code dans notre environnement de test et de le résoudre à l'avance. 

Avec New Relic, nous pouvons voir l'activité et l'expérience de nos utilisateurs — des scientifiques de la conservation autour du monde qui utilisent notre application pour monitorer et enregistrer dans des logs les données sur les espèces animales menacées — afin de comprendre les problèmes auxquels ils font face. Cela nous aide à reconnaître les schémas et à apporter les corrections adéquates. Si l'usage du parcours des utilisateurs baisse soudainement, cela peut indiquer une défaillance quelque part.

Les dashboards montrent les performances de l'infrastructure — mémoire, débits. Par exemple, nous avons eu recours au dashboards lors de la migration. Ils nous ont montré comment un nouvel environnement devrait être créé. En cas de problèmes, nous pouvons voir leur cause profonde. Nous avons mis en place les bases de référence que nous anticipons. Par exemple, si la mémoire dépasse les seuils attendus, nous recevons une alerte.

Notre application est vraiment facile à utiliser. Nous allons soit dans les organisations en personne et nous les formons à son utilisation, ce qui prend une demie-journée, ou ils suivent une formation en ligne courte. Cette convivialité et ce parcours sont très importants pour nous. Au lieu de les former sur la technologie, nous leur apprenons à ajouter leurs détails dans l'application et à changer leur façon de travailler. Les utilisateurs dont aussi face à des problèmes de connectivité selon l'endroit où ils se trouvent. Ils peuvent être sur le terrain pendant 10 jours sans aucune connexion Internet. Ces informations, ces logs, doivent être stockés sur le téléphone et transférés une fois qu'ils retrouvent une connexion.

Avec l'expansion de notre compréhension du monitoring et des possibilités que présente l'observabilité, nous avons mis en place plus de systèmes d'avertissement et de dashboards montrant les états. Nous allons au-delà des seules alertes en cas de gros problèmes et nous comprenons maintenant comment la plateforme est utilisée.

Même s'ils sont de grande qualité, les outils comme New Relic sont rarement une priorité parce qu'il y a toujours un million d'autres tâches à accomplir — surtout si vous n'êtes pas un spécialiste du monitoring. Cela demande trop de temps. C'est la raison pour laquelle nous apprécions particulièrement notre partenariat avec les employés bénévoles de New Relic qui nous aident pro bono. Nous pouvons ainsi nous concentrer pendant une semaine ou deux sur l'observabilité et bénéficier de l'assistance d'experts qui nous aident à comprendre ce que nous devons faire. New Relic est également facile à utiliser et il n'est pas nécessaire d'être technique pour en tirer parti.