Administrar stacks de tecnología complejas y garantizar un tiempo de actividad continuo son retos primordiales para los equipos de ingeniería modernos. Reaccionar a los problemas después de que ocurren suele resultar en tiempos de inactividad costosos y clientes frustrados. ¿La solución? Monitoreo proactivo del rendimiento. Con New Relic AI, puedes pasar del monitoreo reactivo al proactivo aprovechando la IA para prever los problemas antes de que ocurran, identificar tendencias y resolver problemas más rápido.

New Relic AI es el primer asistente de observabilidad basado en GenAI que combina los principales modelos de lenguaje extenso (LLM) con la plataforma de datos de New Relic para comprender tanto tu sistema como la propia plataforma de New Relic, y brinda información mucho más detallada a partir de grandes cantidades de datos de telemetría empleando un lenguaje cotidiano.

En esta publicación del blog, aprenderás a usar New Relic AI para:

  • Analizar tendencias de rendimiento
  • Identificar anomalías 
  • Detectar brechas de monitoreo
  • Configurar monitores sintéticos

Introducción a NRAI

Aunque actualmente se encuentra en versión preliminar, NRAI es fácil de activar. Para comenzar, haz clic en Preguntar a la IA en la esquina superior derecha de cualquier página; luego, haz clic en Comenzar

Se te pedirá que revises los Términos específicos de IA generativa. Si no aceptaste previamente la  Política de prelanzamiento de New Relic, se te pedirá que la revises aquí. Haga clic en Aceptar. Una vez hecho esto, deberías visualizar una ventana de chat. 

Ahora puedes interactuar con el asistente de IA para que te ayude a monitorizar y solucionar problemas de tu sistema.

Analizar tendencias de rendimiento

El monitoreo proactivo comienza con la comprensión del rendimiento histórico de tus servicios. Al analizar las tendencias a lo largo del tiempo, puedes detectar áreas que podrían necesitar atención antes de que se conviertan en problemas importantes.

Para comenzar, puedes pedir a NRAI que resuma el rendimiento de un servicio específico durante un periodo determinado.

¿Cómo funcionó el servicio de catálogo durante la última hora?

NRAI recuperará métricas de rendimiento relevantes, como transacciones, duración promedio y tasas de error, lo que te proporcionará una vista general rápida del estado del servicio, como se muestra en el siguiente ejemplo:

En el ejemplo anterior, NRAI muestra el rendimiento del servicio de catálogo, como las transacciones, la duración promedio y la tasa de errores. Asimismo, puedes pedirle a NRAI que se centre en una métrica específica, como la tasa de error.

¿Hubo algún error en este servicio?

NRAI es capaz de mantener el contexto; además, entiende que desea recuperar los errores de transacción en el "servicio de catálogo" durante las últimas horas. Convierte el lenguaje natural en una consulta New Relic Query Language (NRQL) e indica si hubo algún error en tu servicio. 

Además, puedes solicitar una explicación detallada de estos errores y también investigar las causas subyacentes.

Aquí, New Relic AI muestra la lista de todos los errores en el servicio de catálogo junto con todos los atributos asociados. Puedes analizar con mayor detalle cada error. Es solo cuestión de hacer la pregunta correcta.

Otro aspecto interesante a tener en cuenta es que las métricas que se muestran como parte del análisis de rendimiento varían según el servicio específico que se esté analizando. Por ejemplo: 
 

​​¿Cómo ha estado funcionando el servicio Frontend durante las últimas 24 horas?

Ahora que preguntamos sobre una aplicación de browser, NRAI recupera las métricas relacionadas con la aplicación del browser.

En el ejemplo anterior, NRAI recopila las métricas de la duración promedio del frontend, la primera pintura con contenido (FCP) promedio y la primera pintura (FP) promedio durante las últimas 24 horas.

Para garantizar la estabilidad a largo plazo, puedes comparar el rendimiento entre diferentes periodos de tiempo. Esto ayuda a resaltar tendencias que podrían señalar problemas futuros.

¿Cómo se compara el rendimiento del servicio Frontend durante las últimas 24 horas con el de la última semana?

Con esto, nuestro asistente GenAI te ayudará a identificar si el rendimiento se está degradando gradualmente o si los picos son cada vez más frecuentes, lo que podría indicar problemas más significativos.

En este ejemplo, la duración promedio del frontend mejoró un 2 %, lo que muestra una mejora general.

Identificar anomalías

Una vez que hayas analizado las tendencias de rendimiento, el siguiente paso en el monitoreo proactivo es identificar anomalías: patrones o comportamientos inusuales que podrían señalar un problema. Simplemente, pídele a NRAI que destaque las anomalías recientes. Puedes comenzar pidiéndole a New Relic AI que detecte cualquier actividad inusual o picos en métricas clave, como tasas de error, tiempos de respuesta o, incluso, una vista general de anomalías en tu stack.

¿Se ha detectado alguna anomalía en alguno de mis servicios durante las últimas 24 horas?

Tras escanear tu stack, NRAI te informará sobre cualquier anomalía en tus servicios, como picos repentinos, disminución en las operaciones de E/S, tasa de errores u otros patrones irregulares.

En el ejemplo anterior, New Relic AI detectó dos anomalías: 

  • Disminución de las operaciones de lectura y escritura
  • Aumento del tiempo de escritura

También especifica el contexto en torno a las anomalías y muestra pasos prácticos para resolver cualquier problema de rendimiento relacionado. 

Configurar monitores sintéticos

La monitorización sintética simula las interacciones del usuario con tus aplicaciones, a fin de detectar posibles problemas antes de que afecten a los usuarios reales. Por ejemplo, NRAI puede ayudarte a configurar un monitor sintético que pruebe la disponibilidad de tus servicios con regularidad. Esto garantiza que cualquier degradación del rendimiento se detecte de forma temprana. 

Para comenzar, puedes pedir recomendaciones de monitoreo sintético a New Relic AI.

En el ejemplo anterior, NRAI escanea la stack para identificar las entidades con anomalías y sugiere configurar monitores sintéticos en estas. De forma predeterminada, NRAI crea comprobaciones de ping para tus servicios y aplicaciones. Sin embargo, puede guiarte para configurar un monitor sintético más avanzado, como un browser con script o una prueba de API. Este tipo de monitores te permiten simular interacciones del usuario o llamadas API, a fin de garantizar que tu aplicación no solo sea accesible, sino que también funcione correctamente.

Al configurar monitores sintéticos, puedes detectar problemas antes de que afecten a los usuarios reales, lo que garantiza una experiencia sin contratiempos para todos los que interactúan con tus servicios.

Detectar brechas de monitoreo

Una parte crucial del monitoreo proactivo es garantizar que toda tu stack esté cubierta por alertas y herramientas de monitoreo. La falta de cobertura en áreas claves podría significar que los problemas te tomen por sorpresa. Para identificar servicios no monitoreados, puedes comenzar pidiéndole al asistente que encuentre los espacios vacíos en tu stack. O más específicamente, puedes solicitar áreas en tu stack que actualmente no estén cubiertas por alertas.

Muéstrame todas mis entidades que no estén cubiertas por una alerta.

O también puede pedirle a NRAI que encuentre brechas de cobertura en tu stack.

¿Puedes encontrar brechas de cobertura en mi stack?

La instrucción anterior probablemente generará una lista de entidades que carecen de cobertura de alertas, asegurando que sepas qué partes de tu sistema necesitan más atención para notificar a los equipos sobre problemas que están ocurriendo actualmente. 

Tal como se indica en el ejemplo, puedes acotar tu búsqueda especificando el tipo de aplicación en el que deseas enfocarte. 

Los ejemplos anteriores muestran la lista de servicios de monitoreo del rendimiento de aplicaciones (APM) que no están cubiertos por condiciones de alerta. Una vez que hayas identificado estas brechas, puedes priorizar la configuración de alertas para los servicios más importantes primero. Asimismo, puedes solicitar a New Relic AI recomendaciones sobre las alertas que deberías configurar, tomando como referencia incidentes previos.

Esto garantiza que tus servicios más esenciales estén siempre monitorizados, lo que ayuda a evitar que problemas importantes pasen desapercibidos.

Conclusión

New Relic AI transforma la forma en que monitoriza tu stack, lo que facilita la detección de problemas antes de que se agraven. Al utilizar el asistente potenciado por IA para alertas, análisis de tendencias, investigación de errores y configuración de monitores sintéticos, puedes pasar de un monitoreo reactivo a uno proactivo, lo que asegura operaciones más eficientes y menos incidentes.