El monitoreo del rendimiento de aplicaciones (APM) es esencial para mantener la confiabilidad y el rendimiento de las aplicaciones modernas distribuidas y basadas en microservicios implementadas en la nube. Sin embargo, cuando se utilizan herramientas de APM tradicionales con arquitecturas modernas, a menudo tendrá que lidiar con desafíos como silos de datos, falta de contexto y puntos ciegos que ralentizan la resolución de incidentes. 

Hoy nos complace lanzar New Relic APM 360, la siguiente escala en la evolución del APM, que elimina estas limitaciones al ofrecer a tus equipos una vista unificada de la telemetría esencial de todo el stack de tu aplicación y ciclo de vida de desarrollo, empoderándolo con los conocimientos y los flujos de trabajo diarios que necesita para mejorar el estado y el rendimiento de la aplicación. Ahora todos los ingenieros —independientemente de su rol o experiencia— pueden entender el impacto de los problemas en sentido ascendente o descendente, descubrir las tendencias emergentes y prevenir problemas antes de que se manifiesten.

Con New Relic APM 360, cualquier equipo multifuncional (incluyendo desarrollo, operaciones y seguridad) puede:

  • Prevenir problemas con solo echar un vistazo al estado de la aplicación. 
  • Depurar más rápido gracias a la vista de todo el stack junto con el contexto del usuario y del negocio.
  • Eliminar las brechas de monitoreo con flujos de trabajo guiados y recomendaciones de datos.

Prevenga problemas con solo echar un vistazo al estado de la aplicación

New Relic APM 360 te ofrece información en tiempo real sobre los indicadores de estado clave en todo el stack y todo el ciclo de vida de desarrollo de la aplicación en un solo lugar a través de los mosaicos de resumen de APM. Eso incluye información de problemas, implementaciones, niveles de servicio y vulnerabilidades que son cruciales para monitorear el estado general del servicio y la identificación temprana de los problemas emergentes. Ahora los usuarios cuentan con acceso continuo a toda la información esencial en un solo lugar sin tener que cambiar de pantalla.

Mosaicos de resumen de APM 360 que ilustran problemas, implementaciones, niveles de servicio y vulnerabilidades para el servicio Gateway.

Por ejemplo, los mosaicos de resumen del servicio Gateway (captura de pantalla anterior) proporcionan la siguiente información:

  • Mosaico de problemas (Issues): indica 1 alerta crítica para el servicio Gateway que necesita atención. Al hacer clic en el problema, puedes descubrir un pico en el tiempo de transacción, que es lo que activó la alerta.
  • Mosaico de implementación (Last deployment): muestra una caída del 19% en la tasa de errores y una disminución del 55% en el tiempo de respuesta después de la última implementación. Esto sugiere que la implementación no afectó negativamente el rendimiento del servicio Gateway.
  • Mosaico de niveles de servicio (Service levels): actualmente está vacío, lo cual indica que los niveles de servicio no están configurados para Gateway. Esto pone al servicio Gateway en riesgo de no cumplir con los SLA.
  • Mosaico de vulnerabilidades (Vulnerabilities): destaca una vulnerabilidad alta para el servicio Gateway que necesita evaluación y mitigación para prevenir problemas de seguridad.

Al aprovechar la información presentada en los mosaicos de resumen, puede tomar decisiones informadas sobre dónde centrar su atención y tomar las acciones requeridas para asegurar el rendimiento y la seguridad óptimos de la aplicación. En el caso del servicio Gateway, abordar la alerta crítica y la vulnerabilidad debería ser la prioridad, ya que es probable que afecten el estado y el rendimiento del servicio.

Solucione problemas más rápido con una vista unificada de todo el stack 

New Relic APM 360 lleva el monitoreo al siguiente nivel integrando inteligentemente la información de la infraestructura, el impacto de los errores en el usuario, los patrones de logs y las trazas distribuidas con las señales doradas. Esto elimina las suposiciones y hace que la solución de problemas sea intuitiva y eficiente para todos los ingenieros, independientemente de su experiencia. Ahora puedes correlacionar el rendimiento de la aplicación con las tendencias ascendentes y descendentes para comprender cómo los problemas afectan otras partes de la aplicación en tiempo real.

Infraestructura integrada en el APM

La nueva experiencia de monitoreo de infraestructura en APM 360 conecta los puntos entre tus hosts y servicios, facilitando la identificación de recursos que no han sido aprovisionados adecuadamente y que están impactando los servicios. Te permite navegar sin problemas por todo tu stack, para que puedas identificar y analizar fácilmente la interacción entre tus hosts y las aplicaciones que se ejecutan en ellos. 

Para ilustrar su efectividad, considera el escenario anterior en el que el servicio Gateway recibió una alerta debido a un pico en el tiempo de transacción. Al examinar las métricas de CPU y memoria en la tabla de infraestructura integrada en el resumen de APM (como se muestra en la siguiente captura de pantalla), puedes descartar rápidamente la infraestructura como la causa raíz de este problema de rendimiento.

Monitoreo de infraestructura integrada en APM 360, que muestra las métricas de CPU y memoria.

Simplifica la resolución de problemas con la vista unificada de trazas distribuidas*

Las trazas distribuidas juegan un papel fundamental en la simplificación de la resolución de problemas. Ofrecen información muy valiosa sobre el comportamiento y el rendimiento de los sistemas complejos y distribuidos. Al visualizar las trazas distribuidas junto con la telemetría de APM, puedes identificar eficientemente la causa raíz de los problemas que afectan tu servicio. Con solo unos clics, puedes navegar a la traza relevante y comprender el problema en profundidad. 

A modo de ejemplo, utilicemos el mismo escenario anterior en el que el tiempo de transacción del servicio Gateway está aumentando a pesar de que no hubo despliegues recientes en el servicio y no parece haber problemas con la infraestructura subyacente. 

El componente de trazas distribuidas de APM 360 agiliza la resolución de problemas. Cuando se examina la información revelada por las trazas distribuidas en el resumen de APM (como se muestra en la siguiente captura de pantalla), queda claro que la latencia y los errores del servicio ACME están afectando el servicio Gateway.

Información de las trazas distribuidas en APM 360 que muestra la duración, el recuento de llamadas y las tasas de error para los servicios relacionados.

Al seleccionar el servicio relacionado, puedes observar que la latencia del servicio ACME downstream se ha elevado, lo que afecta directamente al servicio Gateway (Ver la siguiente captura de pantalla.) Para profundizar más en la traza distribuida, simplemente selecciona View trace (Ver traza).

Información de las trazas distribuidas en APM 360 que muestra la duración del servicio de ACME downstream que está afectando al servicio Gateway.

Con la vista unificada de trazas distribuidas en APM 360, puedes aislar rápidamente los servicios problemáticos y acelerar la resolución de problemas. 

Mejora la experiencia del usuario con el impacto del error en el usuario

APM 360 va más allá de las métricas de error brutos para llegar a las analíticas de impacto. Con APM 360, ahora puedes ver qué efecto tienen los errores sobre el usuario, además de la tasa de errores, para que puedas identificar y priorizar los errores que tienen el mayor impacto en tus usuarios y mejorar su experiencia general con tu aplicación.

Continuando con el escenario de ejemplo que describimos anteriormente, observas que el servicio ACME ha estado afectando el rendimiento del servicio Gateway. Profundizando más en el servicio ACME (como se muestra en la captura de pantalla que sigue), observas que la tasa de error ha aumentado después de un despliegue. Con el impacto del error en el usuario puedes identificar que builtins:TimeoutError tiene el mayor impacto en los usuarios, por lo que lo priorizas para la resolución de problemas.

Impacto del error en el usuario en APM 360, mostrando los errores que tienen el mayor efecto en los usuarios de la aplicación.

Infórmate más rápido con patrones de logs contextualizados*

En la misma línea que el impacto del error en el usuario, los patrones de logs son la forma más rápida de descubrir valor en los datos de logs sin buscar.  La búsqueda puede conducir rápidamente a logs que proporcionan una explicación de la causa raíz, pero la mayoría de los datos son repetitivos y difíciles de contextualizar cuando se están explorando. Los patrones pueden hacer que los datos de los logs sean descubribles sin tener que pasar mucho tiempo leyendo datos de poco valor. 

APM 360 incluye patrones de logs en el gráfico de logs, además de los tipos de logs, como parte de su todo-en-uno, facilitando la localización de la causa raíz de los problemas. En la siguiente captura de pantalla, verás que 50 mil de los logs capturados por el servicio ACME tienen un patrón de cadena GET <*> HTTP 1.1 que no está relacionado con los errores que son causas raíz en el servicio ACME. Por lo tanto, puedes ignorar de manera segura estos logs, centrando tu atención en otros logs que son más pertinentes para la resolución de problemas y de incidencias.

Patrones de logs en APM 360 que muestran los logs más pertinentes para la resolución de problemas.

APM 360 ofrece una vista unificada del stack completo que permite una correlación en tiempo real del rendimiento de la aplicación con las tendencias ascendentes y descendentes. Esta visibilidad integral permite a los ingenieros de todos los niveles de experiencia comprender cómo las incidencias afectan a los diversos componentes de la aplicación y acelerar la resolución de problemas. 

Elimina los puntos ciegos con flujos de trabajo guiados y recomendaciones de datos 

Para mejorar tus prácticas de observabilidad, APM 360 te ayuda a resolver las lagunas de monitoreo y a adoptar un monitoreo ininterrumpido. Te guía a través del proceso de descubrir servicios no instrumentados, alertas faltantes, SLO y vulnerabilidades, asegurando que nada importante pase desapercibido y que puedas identificar problemas de los que antes no eras consciente.  

Estos son dos escenarios que ilustran dónde APM 360 descubre las lagunas de monitoreo:

  • SLO faltantes: esta captura de pantalla resalta la ausencia de niveles de servicio para el servicio Gateway.

Mosaico de niveles de servicio en APM 360 que se muestra cuando faltan SLOs para un servicio.

  • Brechas de instrumentación: APM 360 pone en evidencia la falta de instrumentación de la infraestructura dentro del servicio de facturación.

APM 360 identifica que se necesita instalar un agente para la instrumentación de la infraestructura.

Gracias a esta información, APM 360 te asegura una visión completa de tu panorama de monitoreo, para que puedas abordar las deficiencias y fortalecer tu framework de observabilidad.

Empodera a todos los ingenieros para sobresalir

New Relic APM 360 no se trata solo de monitoreo. Se trata de permitir que todos y cada uno de los ingenieros —independientemente de su nivel de experiencia— sean capaces de hacer un trabajo extraordinario con las herramientas de APM. Gracias a la visualización holística del estado del servicio y los indicadores clave de la aplicación que te da APM 360, contarás con toda la información que necesitas para garantizar el rendimiento y el buen estado de tu aplicación, evitar problemas y tener un impacto real en los resultados de tu negocio.