¿Qué es la preparación para la observabilidad?

Su preparación para la observabilidad se trata de monitorear proactivamente indicadores de rendimiento clave (KPI) críticos para sus objetivos comerciales. Para lograr los objetivos comerciales, es fundamental lograr un equilibrio entre la cobertura y la integridad del seguimiento de las aplicaciones. Lograr un equilibrio óptimo ayuda a la organización a fijar, optimizar y mejorar los flujos de procesos según la experiencia del usuario final y la demanda, lo que resulta en un aumento en el retorno de la inversión (ROI). La plataforma New Relic ayuda de manera perfecta y fluida a las empresas a alcanzar sus objetivos.

¿Porqué ahora?

  • La experiencia del cliente es primordial para destacarse en un mercado altamente competitivo.
  • El desarrollo ágil exige múltiples versiones (incluso cientos) en un período corto.
  • Abstracción, integración y complejidad de la modernización de aplicaciones.

La preparación para la observabilidad debe ser parte de su ciclo de lanzamiento o sprint. Esto ayuda con: 

  • El equipo de aplicación para alinearse con objetivos comerciales dinámicos. 
  • El equipo de DevOps y soporte para comprender la gravedad y prioridad de un problema. 
  • Las empresas colaboran eficazmente con los equipos para lograr sus objetivos.

Por el contrario, la Disponibilidad para uso máximo , que es un subconjunto de la preparación para la observabilidad, es importante en términos de ampliar sus recursos vertical u horizontalmente.

Beneficios de la observabilidad continua 

Cada trimestre, su empresa tiene objetivos que se alinean con la meta anual. La observabilidad debe alinearse con esos objetivos y ayudar a las empresas a alcanzar la meta. Por ejemplo:

  • Reducir el coste operativo: Los servicios en la nube y la infraestructura cuestan dinero continuamente a las empresas. Las actualizaciones, implementaciones y cambios del sistema deben monitorearse para garantizar una utilización óptima de los recursos. 
  • Satisfacción de los clientes: Genere confianza con sus clientes entendiendo cómo interactúan con su aplicación y cuáles son los cuellos de botella.  
  • Productividad del empleado: Asegúrese de que su equipo esté familiarizado con la herramienta de observabilidad, la cobertura de observabilidad, la integridad y los puntos ciegos. 
  • ROI: Los KPI comerciales superficiales que más importan deben correlacionarse con el rendimiento de la aplicación. Esto ayuda al equipo de aplicación a enfocarse en las áreas críticas de problema. 
  • Nivel de servicio: Realice un seguimiento de los servicios que no funcionan como se esperaba durante un período y que están afectando la productividad de los empleados y los KPI comerciales.

Proceso de preparación para la observabilidad de New Relic

Veamos los pasos del ciclo de vida de preparación para la observabilidad. 

1

Objetivos empresariales

¿Cuál es el enfoque del año o trimestre actual? ¿Se trata de mejorar el tiempo de actividad, reducir el tiempo de inactividad, obtener más visibilidad o adoptar una nueva iniciativa empresarial como migración a la nube, consolidación de herramientas, adopción de OpenTelemetry, etc.?

2

Arquitectura de observabilidad 

Garantizar que la arquitectura de observabilidad se alinee con los objetivos comerciales es un paso fundamental. Elegir la plataforma New Relic le brinda libertad en sus objetivos comerciales y decisiones de arquitectura. La plataforma New Relic tiene una matriz de características e integración, adopta código abierto y admite aplicaciones personalizadas para satisfacer sus necesidades comerciales específicas.

3

Monitoreo de entidades

Comience a monitorear su aplicación con New Relic, que puede proporcionar un informe en tiempo real de todo su patrimonio actual y también visibilidad de la cobertura y la integridad de la observabilidad.

4

Identificar brechas                          

No siempre es viable monitorear todas sus aplicaciones, servicios, infraestructura, etc. De todos modos, el negocio necesita prosperar. Esto significa que las aplicaciones críticas no deben tener puntos ciegos, datos de telemetría faltantes y puntos de datos empresariales faltantes. Esta es una oportunidad para ser creativo y encontrar soluciones. Visitaremos este punto más adelante en la publicación del blog.

5

Implementar y adoptar

New Relic se integra con su integración continua y despliegue continuo (CI/CD) y facilita la implementación. Los clientes han creado plantillas utilizando recursos de New Relic Terraform, formación de nubes, convenciones, etc. Esto allana el camino para centrarse en la adopción. El equipo de New Relic y el ecosistema se asocian con usted para que este viaje sea sencillo.

6

Medir resultados

Las nuevas características de Relic, como el recorrido del usuario, la administración a nivel de servicio (SLM) y la gestión de calidad de alerta (AQM), lo ayudan a medir los resultados en función de los objetivos establecidos.

7

Repetir

Su observabilidad debería crecer continuamente con su aplicación y sus necesidades comerciales.

Identificar brechas: ¡lo que más importa!

¿Cómo encontramos la brecha que más le importa? 

Recuerde, "el diablo está en los detalles". Identificar aplicaciones críticas, servicios y más es sencillo y es directo y es un buen punto de partida. 

Para los próximos pasos, ¿qué hacemos?

  • Entreviste a diferentes personas como desarrolladores, usuarios y clientes
  • Recopilar comentarios
  • Obtenga informes sobre los tickets creados en los últimos n meses
  • Realizar auditorías de la aplicación existente.
  • Etcétera

Los puntos anteriores son importantes, basados en la evidencia y la experiencia. ¿Cómo podemos ser más eficientes y encontrar las brechas? ¿Ha oído hablar de la ingeniería del caos, del Game Day o de DiRT?

Como enfoque reconocido en ingeniería de software, "la ingeniería del caos es la disciplina de experimentar en un sistema para generar confianza en la capacidad del sistema para soportar condiciones turbulentas en la producción". (wikipedia)

Realizar sesiones de ingeniería del caos 

Encuentre las deficiencias en la resolución de problemas de las sesiones de ingeniería del caos. La ingeniería del caos es como una navaja suiza, ya que le ayuda con:

  • Habilitación y adopción de la característica y funcionalidad de la plataforma New Relic: los miembros del equipo involucrados en estas sesiones aprenden unos de otros. Debe ser un entorno no estresante donde los miembros del equipo puedan revisar y compartir sus hallazgos. Entienden lo que se espera de ellos, a quién contactar y las complejidades del proceso de gestión de incidentes. 
  • Descubra sus puntos ciegos: Los puntos ciegos conducen a un tiempo medio de resolución (MTTR) más alto y también requieren experiencia específica en la sesión de resolución de problemas. 
  • Optimización de datos de telemetría: La comunicación entre equipos, unidades de negocio y personas es fundamental. La sesión de caos brinda la oportunidad de ver si tenemos todos los datos y puntos de información necesarios. Por ejemplo, la empresa podría preguntar por qué las ventas cayeron en la última hora, lo que podría ser el resultado de un cambio de promoción, una interrupción en el servicio de un proveedor, un rendimiento degradado o alguna otra razón que no tiene nada que ver con la aplicación en sí. 
  • Analice el efecto en cascada del rendimiento: Una sesión de ingeniería del caos le permite evaluar y comprender la cobertura y la integridad de la observabilidad. Sin una cobertura adecuada, resulta tedioso decidir el problema, la prioridad y la gravedad. 
  • Cuello de botella: A principios de la década de 2000, si teníamos un problema, generalmente lo atribuíamos a la base de datos o a la red y empezábamos a señalar con el dedo. Hoy en día, tenemos la mejor abstracción, ya sea la nube, los microservicios o la infraestructura. Las aplicaciones son ahora más interdependientes e intradependientes.

Podemos realizar ingeniería del caos utilizando herramientas como Gremlin, Chaos Monkey y Chaos Mesh, o podemos hacerlo manualmente.

Las sesiones de ingeniería del caos lo ayudan a determinar qué es crítico para resistir condiciones turbulentas en la producción. Una vez que determine qué es esencial, la plataforma New Relic puede brindarle información sobre brechas de cobertura, recomendaciones y entidades faltantes, listas para usar y sin contacto.

La plataforma New Relic: Cerrando la brecha

La brecha identificada variará y puede tener un amplio espectro. Con la plataforma New Relic puede implementar de forma rápida y orgánica las capacidades que necesita para estar preparado para la observabilidad. Independientemente de su enfoque de solución de problemas preferido (log-first o metrics-first), puede aprovechar las características de New Relic, como por ejemplo:

  • Registros en contexto: Los registros en contexto proporcionan una vista unificada de sus registros junto con otros puntos de datos de telemetría contextual. Esto garantiza que no se cambiarán herramientas ni se revisarán cientos de líneas de registro y se logrará un análisis de la causa raíz más rápido.
  • Rastreo distribuido: Las trazas proporcionan un análisis exhaustivo del recorrido de su usuario para que pueda identificar el rendimiento del cuello de botella independientemente de los múltiples servicios involucrados en el recorrido del usuario.
  • Seguimiento de cambios/despliegue: El seguimiento de cambios/despliegue le permite monitorear de cerca y mitigar problemas durante y después de uno de los eventos más importantes, “Despliegue” o “Puesta en marcha”, del ciclo de vida del desarrollo de software. 
  • Gestión de vulnerabilidades: La gestión de vulnerabilidades le ayuda a identificar y remediar vulnerabilidades en todo su patrimonio, para que pueda reducir el riesgo de ataque.
  • OpenTelemetry: OpenTelemetry es un estándar abierto para recopilar y exportar datos de telemetría, por lo que puede utilizar New Relic para recopilar datos de cualquier aplicación o infraestructura.
  • Administración a nivel de servicio: SLA/SLM le ayuda a establecer y realizar un seguimiento de los acuerdos de nivel de servicio (SLA) y los objetivos de nivel de servicio (SLO). Esto le ayudará a garantizar que se cumplan sus objetivos comerciales.
  • Carga de trabajo: La carga de trabajo proporciona visibilidad del desempeño de su grupo de servicios. Esto puede ayudar a un equipo a mantenerse concentrado y mantener las luces encendidas. 

Implemente las mejores prácticas de monitoreo según corresponda a su entorno particular. Esto garantizará que la cobertura y la integridad de la observabilidad funcionen donde más importan y le ayudarán a controlar los costos.

Resumen

Lograr la preparación para la observabilidad es esencial para cualquier organización que busque mantener un enfoque proactivo para monitorear y mejorar su aplicación e infraestructura. Al seguir el proceso de preparación para la observabilidad y aprovechar el poder de la plataforma New Relic, las empresas pueden garantizar que sus sistemas estén preparados para cualquier desafío y alineados con sus objetivos. No espere a una temporada de alta demanda o a un evento crítico; comience a trabajar para estar preparado para la observabilidad hoy.