Global Processing utiliza New Relic AI para integrar a los ingenieros más rápidamente

Location
Argentina
Business Challenge
Company Size
200-500 empleados
50%
reducción del exceso de alertas
30%
mejora del MTTR
10%
dominio más rápido de NRQL

En América Latina, millones de personas dependen de la banca electrónica y los pagos digitales. Global Processing se asegura de que esos sistemas funcionen perfectamente al procesar transacciones de empresas líderes de comercio electrónico como Ualá, además de bancos y proveedores de billeteras electrónicas.

Las operaciones diarias de los proveedores de servicios financieros son intensas, ya que los problemas tecnológicos tienen un impacto directo sobre la capacidad de los clientes de realizar transacciones y acceder a sus fondos. Por esta razón, Global Processing debe ajustarse a estándares muy estrictos y las compañías de tarjetas de crédito le hacen pagar las consecuencias de cada segundo de inactividad. El trabajo de Global Processing se hace aun más complicado por el hecho de que tiene que trabajar con una amplia gama de APIs de todo tipo para una variedad de clientes, lo que significa que, en caso de ocurrir un incidente, las implicaciones son mayores.

Después de probar distintas soluciones de monitoreo del rendimiento de aplicaciones (APM), Global Processing adoptó New Relic en 2023 y los resultados no se hicieron esperar.

Simplificar incidentes y reducir exceso de alertas

Mantener las métricas de rendimiento estrictas con un juego altamente complejo de APIs era difícil para el equipo de observabilidad de Global Processing. Los ingenieros tenían que verificar constantemente los distintos dashboards y tratar de consolidar la información dispersa. A pesar de que estos dashboards permitían hacer verificaciones de estado básicas, no lograban proporcionar información útil. El Service Operations Center (SOC) no tenía más remedio que contactar a equipos de guardia casi de inmediato cada vez que detectaban una anomalía, provocando un aumento en las cargas de trabajo y los niveles de estrés de los integrantes del equipo de guardia 

Se creaba una alerta por cada anomalía dando origen a cientos de correos electrónicos que se acumulaban en las bandejas de entrada. Un volumen excesivo de alertas —que solían ser falsas alarmas— limitaba la capacidad del equipo de ocuparse de los problemas verdaderos de una manera eficiente y resultaba en un exceso de alertas puesto que las oleadas de notificaciones hacían imposible identificar los problemas relevantes.

Este exceso en el sistema resaltó la necesidad de utilizar un método más inteligente para la detección de anomalías y la administración de alertas. Al proporcionar información detallada y despejar el camino para las alertas que sí son importantes, la gestión del rendimiento de aplicaciones de New Relic (APM) ayuda a Global Processing a resolver los problemas rápidamente y evitar el costoso tiempo de inactividad. 

“Un CPU puede dispararse solo porque se está haciendo una copia de respaldo, pero si ese disparo afecta la experiencia del usuario, yo tengo que saberlo. Necesitábamos que New Relic separara el problema verdadero de lo superfluo”, afirma Santiago Lator, Responsable del Equipo de Observabilidad de Global Processing.

“No quiero ser el guardián de la información. Las herramientas como New Relic AI ayudan mucho. Si no estás acostumbrado a estas plataformas, te puedes perder rápidamente. Con New Relic, cualquiera puede acceder a la información al instante, esa es una de las grandes virtudes de New Relic AI”.

Cuando llegó el momento de tomar una decisión sobre New Relic, lo que verdaderamente convenció a Global Processing fue el sistema de alertas. La capacidad de establecer umbrales y correlacionar los incidentes entrantes dio como resultado una reducción inmediata del número de alertas. En apenas dos meses, el volumen de incidentes de la compañía en su plataforma de tickets cayó un 50% puesto que las alertas ahora solo se crean por anomalías importantes. Global Processing también comenzó a usar New Relic para registrar incidentes automáticamente en su plataforma de gestión de tickets. 

Con la mitad de las alertas de antes, los equipos en guardia han observado una reducción significativa de la presión y han reportado un efecto positivo en su salud mental. Los equipos se concentran en resolver el incidente, gracias a las respuestas rápidas de New Relic, en lugar de perder su tiempo en tareas administrativas, como el ingreso manual de datos y la clasificación de incidentes en el sistema de seguimiento. Esto no solo ayuda a ahorrar tiempo, sino que aumenta la capacidad de los equipos para responder a los verdaderos riesgos de manera eficaz. El tiempo que el equipo de SOC dedicaba antes a crear tickets manualmente ahora lo dedica a estrategias proactivas, como la mejora continua de las políticas de seguridad, la identificación de posibles vulnerabilidades y la implementación de medidas de prevención ante riesgos futuros. Al concentrarse en anomalías relevantes, los equipos se ocupan de las alertas críticas, en lugar de verse inundados de problemas de poca importancia.

Integración impulsada por IA y un APM completo

Global Processing también ha sido uno de los primeros en adoptar New Relic AI. El equipo de observabilidad de Global Processing está empeñado en democratizar el acceso a la información y New Relic AI les está ayudando a conseguir su objetivo. Los integrantes del equipo que tienen poca o ninguna experiencia en el campo de la observabilidad pueden encontrar lo que quieren fácilmente en la plataforma. Con New Relic AI, las personas interesadas pueden obtener respuestas al instante a preguntas como “¿Cómo está mi servicio?” o “¿Qué SLA estoy incumpliendo?”

“Una de las cosas que me encantan de New Relic AI es que puedes hacer preguntas acerca de tu propia telemetría y la documentación de New Relic. Estábamos teniendo problemas con algunos archivos de configuración y no podíamos obtener el parámetro de configuración exacto que necesitábamos cambiar. Le preguntamos a New Relic AI y prácticamente nos dio la respuesta que buscábamos. Antes de New Relic AI, teníamos que probar qué funcionaba”.

Para los ingenieros que tienen experiencia con el uso de APM, cambiarse a una plataforma nueva con dashboards, señales y métricas que son exclusivos de la plataforma, también puede ser agobiante. New Relic AI facilita la integración porque proporciona respuestas e información útil al instante sobre preguntas relacionadas con el rendimiento de una aplicación o sobre cómo desplazarse por la plataforma. Y puesto que New Relic AI comparte la consulta que traduce de lenguaje natural a New Relic Query Language (NRQL) en su respuesta final, los ingenieros de Global Processing también han dominado el NRQL un 10% más rápido usando la capacidad de IA, lo que a su vez acelera su capacidad de optimizar la rentabilidad de su inversión en observabilidad.

Reducción del 30% del MTTR: el tiempo de actividad aumenta y la experiencia del usuario mejora

Gracias a New Relic, Global Processing está pasando de un juego de herramientas fragmentado a un sistema centralizado. El monitoreo que abarca todo el sistema de New Relic y las alertas accionables han originado un 30% de reducción en el tiempo medio de resolución (MTTR), lo cual reduce el tiempo de inactividad e impulsa la eficiencia operacional. El equipo de Global Processing ahora tiene las herramientas que le permiten continuar persiguiendo su objetivo fundamental: facilitar una experiencia excepcional a sus clientes. Gracias a New Relic AI, cada uno de los integrantes del equipo tiene acceso a la información que necesita en solo segundos y el equipo de observabilidad puede dedicarse a completar las tareas fundamentales en lugar de tener que ocuparse de una cola interminable de tickets.