Mantener el rendimiento, la disponibilidad y el estado de la infraestructura de TI es absolutamente esencial en el panorama digital actual. Ahí es donde entra en juego el monitoreo de infraestructura. En esencia, es un sistema diseñado para proporcionar información valiosa en tiempo real a toda tu stack, garantizando un rendimiento óptimo y señalando problemas potenciales antes de que se agraven. Desde servicios en la nube hasta servidores locales, profundizaremos en el monitoreo de infraestructura, su importancia, funcionalidad e impacto en las empresas modernas. ¡Empecemos!

¿Qué es el monitoreo de infraestructura?

El monitoreo de infraestructura es un software que te ayuda a supervisar, identificar rápidamente y solucionar problemas en toda tu infraestructura, incluyendo servicios basados en la nube, hosts locales, contenedores orquestados y las máquinas virtuales. Puedes utilizar el monitoreo de infraestructura para obtener una observabilidad completa de sistemas complejos e híbridos, como centros de datos y servicios basados en la nube como Amazon Web Services (AWS) y Microsoft Azure. También puedes utilizar monitoreo de infraestructura para obtener una vista de alto nivel de la CPU, la RAM, el almacenamiento y el tráfico de red de su sistema. Con esta información valiosa, el ingeniero puede identificar y solucionar problemas de rendimiento dentro de servidores, contenedores, clústeres de Kubernetes, base de datos, servicios en el host y más, ya sea localmente o en la nube. Más específicamente, el monitoreo de infraestructura ofrece métricas de desempeño detalladas, valores de tendencias e información predictiva valiosa permitiendo a las empresas ajustar sus recursos, mejorar el tiempo de actividad y garantizar un servicio fluido.

Continúa leyendo para obtener más información sobre el monitoreo de infraestructura, incluido por qué es importante y qué debes buscar en una herramienta de monitoreo de infraestructura.

¿Qué es la infraestructura de aplicaciones?

La infraestructura de aplicaciones son todos los activos que permiten que tus sistemas y tecnología funcionen, incluidas redes, dispositivos de hardware y servidores, ya sea que estén basados en la nube o en las instalaciones. Incluso si utilizas soluciones en la nube, esa infraestructura todavía se basa en un servidor físico en algún lugar. La infraestructura de aplicaciones es como los cimientos de un edificio: no se puede ver, pero sostiene todo el edificio.

En última instancia, se puede pensar que la infraestructura de aplicaciones consta de tres capas:

  • Hardware: El hardware incluye todos los componentes físicos que alojan tu infraestructura. Incluye los servidores físicos y los procesadores, dispositivos de red y otros dispositivos físicos que utiliza tu sistema. En última instancia, esta capa se construye sobre microchips, incluidos chips lógicos (CPU) y chips de memoria (RAM). También existen otros tipos de chips, incluidas las unidades de procesamiento neuronal (NPU), que están diseñadas para aplicaciones de aprendizaje automático.
  • Sistema operativo (OS): El sistema operativo proporciona una interfaz que conecta las dos capas de la infraestructura de aplicaciones: el hardware y la aplicación misma. El sistema operativo ejecuta la aplicación al mismo tiempo que utiliza recursos de hardware como CPU y RAM. Esto también incluye máquinas virtuales, que cuentan con su propio sistema operativo.
  • Aplicación: Esta es la aplicación en sí, que podría ser una aplicación personalizada que hayas desarrollado o una aplicación que utilice un sistema de gestión de contenidos como WordPress. La capa de aplicación también incluye contenedores, que se utilizan para ejecutar muchas aplicaciones.
ESTUDIO DE CASO DE ZENHUB
ZenHub logo

Si utilizas servidores locales, debes pensar en todas estas capas, incluido asegurarse de que tu hardware funcione correctamente. Con la infraestructura basada en la nube, ya no tendrás que preocuparte por el hardware de la misma manera, porque tu proveedor de la nube mantiene la infraestructura que aloja tu software y aplicaciones. Sin embargo, todavía es necesario pensar en el aprovisionamiento de recursos: CPU, memoria, almacenamiento y redes. Si tu aplicación no tiene un aprovisionamiento suficiente, no funcionará correctamente, y si tiene un aprovisionamiento excesivo, estarás desperdiciando dinero en capacidad que no necesitas.

La siguiente imagen muestra un dashboard en New Relic Explorer con una vista de alto nivel del contenedor, servicios, hosts y más.

How does infrastructure monitoring work?

Like other types of monitoring, infrastructure monitoring usually involves instrumenting a host by installing an agent. In the case of a monitoring solution like New Relic, you can begin the process of instrumentation with a simple guided installation. The agent automatically detects the application and log sources running in your environment and then recommends which ones you should instrument.

Once your hosts are fully instrumented, the agent will collect system data and send it to your infrastructure monitoring solution. In some cases, the agent will forward data and logs, particularly in the case of integrations.

The following chart shows how a New Relic on-host integration receives data from a service like Redis or Apache.

¿Por qué es importante el monitoreo de infraestructura?

Independientemente de si tu aplicación utiliza hosts locales o basados en la nube (o ambos), la infraestructura proporciona la base para tus sistemas. Así como un tren solo puede operar en vías que estén bien mantenidas, tu sistema necesita servidores confiables y de alto rendimiento para garantizar que los servicios se entreguen a tu usuario. Cuando la infraestructura falla, el rendimiento de tu aplicación se ve afectado e incluso es posible que se produzcan interrupciones. Debido a que hay mucho en juego, el mantenimiento de la infraestructura puede ser a la vez desafiante y estresante. Incluso si tus servidores tienen casi un 100 % de tiempo de actividad, las interrupciones que se producen pueden ser graves. Las interrupciones y el tiempo de inactividad afectan tu autoridad y la confianza de tus usuarios. En el mejor de los casos, tus usuarios no puede acceder a sus servicios durante una interrupción y, en el peor, tus usuarios se frustran y no regresan.

Si bien puedes monitorear cosas como la CPU y la RAM de un sistema en una línea de comando del sistema operativo, necesitas una solución más integral para monitorear la infraestructura de la aplicación, especialmente a medida que tus aplicaciones se vuelven más grandes y más complejas. Ahí es donde entran en juego las herramientas de monitoreo de infraestructura. Una herramienta de monitoreo de infraestructura como New Relic te permite visualizar toda la infraestructura de tu sistema desde un solo lugar, incluyendo métricas, eventos, registros y trazas (MELT).

El monitoreo de infraestructura es sólo una parte de una práctica de observabilidad completa. La observabilidad consiste en recopilar, visualizar y alertar proactivamente sobre datos en todos tus sistemas, incluida tu infraestructura. Idealmente, la plataforma que utilices también debería monitorear otros aspectos de tu aplicación, incluido el rendimiento de la aplicación. De esa manera, puedes identificar y corregir errores que surjan en tu infraestructura y en otras partes de tus aplicaciones.

Beneficios del monitoreo de infraestructura:

  • Encontrar y corregir rápidamente las interrupciones y otros problemas relacionados con la infraestructura.
  • Apoyar a tus equipos de ingeniería, DevOps y TI que trabajan con la infraestructura de aplicaciones y dependen de ella.
  • Proporcionar al usuario final una experiencia consistente y positiva, que a su vez impacte positivamente en el resultado final.

 

¿Qué se puede monitorear con una solución de monitoreo de infraestructura?

Una solución de monitoreo de infraestructura te permite monitorear todas las partes de la infraestructura de tu aplicación. En el caso de New Relic, obtienes lo siguiente de forma predeterminada una vez que tu infraestructura está instrumentada:

  • El estado actual del servidor, incluida la CPU, la memoria, el disco y la red. 
  • El uso y la capacidad de un dispositivo de almacenamiento asociado con el servidor.
  • Los datos de uso para cada dispositivo de red asociado con el servidor.
  • Datos sobre todos los contenedores docker y clúster de Kubernetes, incluidas métricas sobre CPU, memoria y redes.
  • Cualquier cambio en el estado activo de un sistema, que se almacena en un InfrastructureEvent.

Además de la instrumentación, también puedea utilizar la integración para analizar, visualizar y alertar sobre datos de otras partes de tu infraestructura. New Relic tiene dos categorías principales de integración de infraestructura:

Una plataforma de monitoreo de infraestructura también debería proporcionar suficiente flexibilidad para tus propias soluciones personalizadas. Incluso puedes ser creativo y monitorear la infraestructura en el entorno de tu hogar. Así es como un ingeniero utilizó New Relic para monitorear la matriz solar de su hogar.

La siguiente imagen muestra un ejemplo de monitoreo de clúster de Kubernetes en New Relic Explorer.

Métricas de monitoreo de infraestructura

Las métricas de monitoreo de infraestructura arrojan luz sobre el rendimiento y la confiabilidad de tu sistema. Aquí hay algunas métricas comúnmente monitoreadas:

Métricas de CPU

  • Uso de CPU
  • Promedio de carga de CPU
  • Tiempo de CPU inactivo
  • Tiempo de espera de la CPU

Métricas de memoria

  • Memoria total
  • Memoria usada
  • Memoria gratis
  • Intercambios de páginas de memoria

Métricas de disco

  • Tasas de lectura/escritura de disco
  • E/S de disco
  • Utilización del disco
  • Capacidad del disco

Salud de la infraestructura

  • Tiempo activo/inactivo
  • Disponibilidad del sistema
  • Errores de hardware
  • Estado del servicio/proceso

Esta lista no es exhaustiva y la métrica puede variar según la naturaleza exacta de la infraestructura. Aún así, estos proporcionan una comprensión fundamental del rango de métricas que son esenciales para monitorear tu infraestructura.

Casos de uso de monitoreo de infraestructura

El monitoreo de infraestructura actúa como los ojos y oídos de los equipos de TI, ofreciendo información valiosa que se extiende a varios escenarios operativos. Estos incluyen lo siguiente:

  • Detección proactiva de problemas: Antes de que un problema menor se convierta en una interrupción importante, las herramientas de monitoreo de infraestructura pueden alertar al administrador para que tome medidas.
  • Monitoreo del tiempo de actividad y el rendimiento del sitio web: Las herramientas de monitoreo pueden supervisar el estado del servidor web, la capacidad de respuesta de la base de datos e incluso la experiencia del usuario final en tiempo real.
  • Planificación de capacidad: Analiza datos históricos para predecir cuándo la infraestructura podría alcanzar sus límites.
  • Cumplimiento: El monitoreo y el registro continuos pueden proporcionar un seguimiento detallado de la actividad que garantiza que se cumplan los estándares de cumplimiento.
  • Comentarios posteriores al despliegue: Para las empresas que adoptan prácticas de DevOps, el monitoreo proporciona comentarios posteriores al despliegue, lo que facilita la detección de cualquier ineficiencia.

¿Cómo funciona el monitoreo de infraestructura?

Al igual que otros tipos de monitoreo, el monitoreo de infraestructura generalmente implica instrumentar un host mediante la instalación de un agente. En el caso de una solución de monitoreo como New Relic, se puede comenzar el proceso de instrumentación con una sencilla instalación guiada. El agente detecta automáticamente las fuentes de aplicaciones y log que se ejecutan en tu entorno y luego recomienda cuáles debes instrumentar.

Una vez que tus hosts estén completamente instrumentados, el agente recopilará datos del sistema y los enviará a su solución de monitoreo de infraestructura. En algunos casos, el agente enviará datos y registros, particularmente en el caso de la integración.

El siguiente cuadro muestra cómo una integración en el host de New Relic recibe datos de un servicio como Redis o Apache.

EL MONITOREO DE INFRAESTRUCTURA DE NEW RELIC
Image of stacked rows of black, shiny, 3-D hexagons

Al igual que otros tipos de monitoreo de aplicaciones, el monitoreo de infraestructura involucra datos de MELT: métricas, eventos, log y trazas.

Log, que son acciones discretas que ocurren en una aplicación, son los componentes básicos de métricas, eventos y trazas. Están formados por una sola línea de texto. Por ejemplo, un servidor NGINX registrará todas las transacciones que ocurran. Los eventos pueden consistir en varias líneas de datos de log. Junto con trazas, que conectan eventos entre sí, los eventos proporcionan más contexto sobre lo que está sucediendo en tu infraestructura.

Finalmente, las métricas son datos agregados que te brindan una vista de alto nivel de lo que sucede en tu aplicación. Un ejemplo es la latencia promedio de un servicio durante los últimos siete días. Las métricas te ofrecen un panorama más amplio y son especialmente útiles para visualizar el estado general y el rendimiento de tu infraestructura. También es importante saber cómo la interrupción de la infraestructura juega un papel importante, ya que el uso proactivo de la tecnología para impulsar la innovación empresarial está cobrando cada vez más importancia.

Las mejores prácticas de monitoreo de infraestructura

  • Adopta un enfoque holístico: Ve más allá del monitoreo de componentes aislados y considera todo el ecosistema de infraestructura, incluidos los servidores, la base de datos, el equipo de red y la aplicación.
  • Configura alertas integrales: Con el sistema de alerta adecuado, los equipos pueden pasar de reactivos a proactivos. Elije estratégicamente aquello sobre lo que te gustaría estar alerta.
  • Revisa periódicamente las métricas y los datos que se recopilan: Asegúrate de que tus herramientas y parámetros de monitoreo sigan siendo relevantes a medida que evoluciona tu infraestructura.
  • Prueba Prueba Prueba: Probar tu infraestructura en condiciones de alta carga revelará posibles puntos débiles y evitará desastres en el mundo real.
  • Crea un panel de monitoreo de infraestructura para tu equipo: El panel de monitoreo de infraestructura es un centro centralizado para comprender el estado de tu sistema actual. Utilízalos para discutir, analizar y colaborar en temas mientras tienes una comprensión colectiva del rendimiento de la infraestructura.

Elije la herramienta de monitoreo de infraestructura adecuada: Selecciona una herramienta que se alinee con las necesidades, la escala y los objetivos de tu organización. No olvides considerar la experiencia del usuario, las capacidades de integración, la confiabilidad y la rentabilidad.

¿Por qué monitorear la infraestructura con New Relic?

Sumérgete en el futuro del monitoreo de infraestructura y observabilidad con New Relic. Nuestra plataforma no solo brinda a cada ingeniero más de 30 capacidades en APM, infraestructura y más, sino que también viene con un modelo de precios basados en el consumo que elimina las tarifas de licencia por usuario. Esto significa que puedes administrar tus gastos operativos de manera más eficiente y, al mismo tiempo, brindar a cada ingeniero las herramientas que necesita.

Precios rentables y transparentes

Consolida tu conjunto de herramientas y administra los costos de manera efectiva a medida que escalas. Con los precios basados en el consumo de New Relic, podrás gastar sólo un tercio de lo que gastarías con Datadog. Para obtener una comparación detallada, consulta nuestro blog comparativo entre Datadog y New Relic .

Desglosa los silos de datos para una rápida remediación

Dile adiós a los silos de datos. New Relic conecta tus datos de infraestructura y APM , ofreciendo visibilidad sin restricciones en toda tu stack. Esta visión holística permite a los equipos solucionar problemas de rendimiento hasta un 80 % más rápido, sin importar en qué equipo estén.

Colaboración perfecta entre equipos

Nuestra plataforma de observabilidad única sirve como una fuente confiable unificada, lo que permite que los ingenieros de todos los equipos colaboren de manera eficiente cuando surgen problemas. No se requieren herramientas adicionales y no es necesario realizar compras para agregar usuarios o SKU.

Comienza ahora mismo

Regístrate en el nivel gratuito de New Relic y profundiza en nuestra documentación integral de monitoreo de infraestructura y mejores prácticas. Obtén experiencia práctica a través de nuestro laboratorio "Identifica la causa raíz de los problemas en tu infraestructura".

 

Experimenta la diferencia de New Relic hoy y transforma la forma en que monitoreas, observas y optimizas tu infraestructura.