En América Latina, millones de personas dependen de la banca electrónica y los pagos digitales. Global Processing se asegura de que esos sistemas funcionen perfectamente al procesar transacciones de empresas líderes de comercio electrónico como Ualá, además de bancos y proveedores de billeteras electrónicas.
Las operaciones diarias de los proveedores de servicios financieros son intensas, ya que los problemas tecnológicos tienen un impacto directo sobre la capacidad de los clientes de realizar transacciones y acceder a sus fondos. Por esta razón, Global Processing debe ajustarse a estándares muy estrictos y las compañías de tarjetas de crédito le hacen pagar las consecuencias de cada segundo de inactividad. El trabajo de Global Processing se hace aun más complicado por el hecho de que tiene que trabajar con una amplia gama de APIs de todo tipo para una variedad de clientes, lo que significa que, en caso de ocurrir un incidente, las implicaciones son mayores.
Después de probar distintas soluciones de monitoreo del rendimiento de aplicaciones (APM), Global Processing adoptó New Relic en 2023 y los resultados no se hicieron esperar.
Simplificar incidentes y reducir exceso de alertas
Mantener las métricas de rendimiento estrictas con un juego altamente complejo de APIs era difícil para el equipo de observabilidad de Global Processing. Los ingenieros tenían que verificar constantemente los distintos dashboards y tratar de consolidar la información dispersa. A pesar de que estos dashboards permitían hacer verificaciones de estado básicas, no lograban proporcionar información útil. El Service Operations Center (SOC) no tenía más remedio que contactar a equipos de guardia casi de inmediato cada vez que detectaban una anomalía, provocando un aumento en las cargas de trabajo y los niveles de estrés de los integrantes del equipo de guardia
Se creaba una alerta por cada anomalía dando origen a cientos de correos electrónicos que se acumulaban en las bandejas de entrada. Un volumen excesivo de alertas —que solían ser falsas alarmas— limitaba la capacidad del equipo de ocuparse de los problemas verdaderos de una manera eficiente y resultaba en un exceso de alertas puesto que las oleadas de notificaciones hacían imposible identificar los problemas relevantes.
Este exceso en el sistema resaltó la necesidad de utilizar un método más inteligente para la detección de anomalías y la administración de alertas. Al proporcionar información detallada y despejar el camino para las alertas que sí son importantes, la gestión del rendimiento de aplicaciones de New Relic (APM) ayuda a Global Processing a resolver los problemas rápidamente y evitar el costoso tiempo de inactividad.
“Un CPU puede dispararse solo porque se está haciendo una copia de respaldo, pero si ese disparo afecta la experiencia del usuario, yo tengo que saberlo. Necesitábamos que New Relic separara el problema verdadero de lo superfluo”, afirma Santiago Lator, Responsable del Equipo de Observabilidad de Global Processing.
Cuando llegó el momento de tomar una decisión sobre New Relic, lo que verdaderamente convenció a Global Processing fue el sistema de alertas. La capacidad de establecer umbrales y correlacionar los incidentes entrantes dio como resultado una reducción inmediata del número de alertas. En apenas dos meses, el volumen de incidentes de la compañía en su plataforma de tickets cayó un 50% puesto que las alertas ahora solo se crean por anomalías importantes. Global Processing también comenzó a usar New Relic para registrar incidentes automáticamente en su plataforma de gestión de tickets.
Con la mitad de las alertas de antes, los equipos en guardia han observado una reducción significativa de la presión y han reportado un efecto positivo en su salud mental. Los equipos se concentran en resolver el incidente, gracias a las respuestas rápidas de New Relic, en lugar de perder su tiempo en tareas administrativas, como el ingreso manual de datos y la clasificación de incidentes en el sistema de seguimiento. Esto no solo ayuda a ahorrar tiempo, sino que aumenta la capacidad de los equipos para responder a los verdaderos riesgos de manera eficaz. El tiempo que el equipo de SOC dedicaba antes a crear tickets manualmente ahora lo dedica a estrategias proactivas, como la mejora continua de las políticas de seguridad, la identificación de posibles vulnerabilidades y la implementación de medidas de prevención ante riesgos futuros. Al concentrarse en anomalías relevantes, los equipos se ocupan de las alertas críticas, en lugar de verse inundados de problemas de poca importancia.
Integración impulsada por IA y un APM completo
Global Processing también ha sido uno de los primeros en adoptar New Relic AI. El equipo de observabilidad de Global Processing está empeñado en democratizar el acceso a la información y New Relic AI les está ayudando a conseguir su objetivo. Los integrantes del equipo que tienen poca o ninguna experiencia en el campo de la observabilidad pueden encontrar lo que quieren fácilmente en la plataforma. Con New Relic AI, las personas interesadas pueden obtener respuestas al instante a preguntas como “¿Cómo está mi servicio?” o “¿Qué SLA estoy incumpliendo?”
Para los ingenieros que tienen experiencia con el uso de APM, cambiarse a una plataforma nueva con dashboards, señales y métricas que son exclusivos de la plataforma, también puede ser agobiante. New Relic AI facilita la integración porque proporciona respuestas e información útil al instante sobre preguntas relacionadas con el rendimiento de una aplicación o sobre cómo desplazarse por la plataforma. Y puesto que New Relic AI comparte la consulta que traduce de lenguaje natural a New Relic Query Language (NRQL) en su respuesta final, los ingenieros de Global Processing también han dominado el NRQL un 10% más rápido usando la capacidad de IA, lo que a su vez acelera su capacidad de optimizar la rentabilidad de su inversión en observabilidad.
Reducción del 30% del MTTR: el tiempo de actividad aumenta y la experiencia del usuario mejora
Gracias a New Relic, Global Processing está pasando de un juego de herramientas fragmentado a un sistema centralizado. El monitoreo que abarca todo el sistema de New Relic y las alertas accionables han originado un 30% de reducción en el tiempo medio de resolución (MTTR), lo cual reduce el tiempo de inactividad e impulsa la eficiencia operacional. El equipo de Global Processing ahora tiene las herramientas que le permiten continuar persiguiendo su objetivo fundamental: facilitar una experiencia excepcional a sus clientes. Gracias a New Relic AI, cada uno de los integrantes del equipo tiene acceso a la información que necesita en solo segundos y el equipo de observabilidad puede dedicarse a completar las tareas fundamentales en lugar de tener que ocuparse de una cola interminable de tickets.