O monitoramento do desempenho de aplicativos (APM) é essencial para a manutenção da confiabilidade e do desempenho de aplicativos distribuídos baseados em microsserviços implantados na nuvem. Mas quando as ferramentas tradicionais de APM são usadas com arquiteturas modernas, com frequência você tem que lidar com desafios como silos de dados, ausência de contexto e pontos cegos que retardam a solução de incidentes.
Hoje estamos lançando o New Relic APM 360, a evolução mais recente do APM, que elimina essas limitações porque fornece uma visão unificada de dados essenciais de telemetria em todo o seu stack de aplicativos e ciclo de desenvolvimento, apresentando insights e fluxos de trabalho diários necessários para que você melhore a saúde e o desempenho dos aplicativos. Agora, todos os engenheiros, independentemente da função e da experiência, podem compreender os impactos upstream e downstream dos problemas, descobrir tendências emergentes e evitar problemas antes que se manifestem.
Com o New Relic APM 360, qualquer equipe multifuncional (incluindo dev, ops e segurança) pode:
- Evitar problemas com uma visão rápida da saúde do aplicativo.
- Resolver bugs mais rapidamente com uma visão do stack inteiro associada ao contexto do usuário e da empresa.
- Eliminar lacunas de monitoramento com fluxos de trabalho guiados e recomendações de dados.
Evite problemas com uma visão geral da saúde do aplicativo
O New Relic APM 360 oferece insights em tempo real sobre indicadores críticos de saúde em todo o stack e ciclo de desenvolvimento de aplicativos, tudo em um só lugar usando os blocos de resumo do APM. Isso inclui informações sobre problemas, implantações, níveis de serviço e vulnerabilidades que são cruciais para o monitoramento da saúde geral do serviço e a identificação precoce de problemas emergentes. Agora, os usuários têm acesso contínuo a todas as informações essenciais em um só lugar, sem ter que trocar de tela.
Por exemplo, os blocos de resumo do serviço Gateway, na captura de tela anterior, fornecem estas informações:
- Bloco de problema: indica 1 alerta crítico para o serviço Gateway que requer atenção. Clicando no problema, você pode descobrir um pico no tempo de transação, que acionou o alerta.
- Bloco de implantação: mostra uma queda de 19% na taxa de erros e uma redução de 55% no tempo de resposta após a última implantação. Isso sugere que a implantação não afetou negativamente o desempenho do serviço Gateway.
- Bloco de nível de serviço: vazio no momento, o que indica que os níveis de serviço não foram configurados para o Gateway. Isso deixa o serviço Gateway em risco de não cumprir os SLAs.
- Bloco de vulnerabilidade: destaca uma alta vulnerabilidade para o serviço Gateway que precisa ser avaliada e mitigada para evitar problemas de segurança.
Usando as informações apresentadas nos blocos de resumo, você pode tomar decisões bem embasadas sobre quais devem ser seus focos de atenção e adotar as medidas necessárias para garantir desempenho e segurança ótimos do aplicativo. No caso do serviço Gateway, a prioridade deve ser analisar o alerta crítico e a vulnerabilidade, pois provavelmente afetarão a saúde e o desempenho do serviço.
Resolva problemas mais rápido com uma visão unificada de todo o stack
O New Relic APM 360 eleva o monitoramento a um novo patamar, pois integra de maneira inteligente insights sobre infraestrutura, impacto dos erros sobre os usuários, padrões de log e distributed traces com sinais clássicos. Isso elimina as especulações e torna a resolução de problemas intuitiva e eficiente para todos os engenheiros, independentemente do nível de conhecimento. Agora, você pode correlacionar o desempenho do aplicativo a tendências upstream e downstream para entender, em tempo real, como os problemas afetam outras partes do aplicativo.
Infraestrutura integrada no APM
A nova experiência de monitoramento de infraestrutura no APM 360 conecta os pontos entre hosts e serviços, facilitando a identificação dos recursos pouco provisionados que estão afetando seus serviços. Isso ajuda você a navegar sem problemas por todo o seu stack e, assim, identificar e analisar facilmente a interação entre seus hosts e os aplicativos que são executados neles.
Para ilustrar a eficácia, considere o cenário anterior no qual o serviço Gateway recebeu um alerta devido a um pico no tempo de transação. Examinando as métricas de CPU e memória na tabela de infraestrutura integrada no resumo do APM, como mostrado na próxima captura de tela, você pode eliminar rapidamente a infraestrutura como a causa raiz desse problema de desempenho.
Simplifique a resolução de problemas com a visão unificada de distributed traces*
Os distributed traces desempenham um papel fundamental para simplificar a resolução de problemas. Eles oferecem insights valiosos sobre o comportamento e o desempenho de sistemas distribuídos complexos. Vendo os distributed traces junto com a telemetria do APM, você pode identificar com eficiência a causa raiz dos problemas que estão afetando o seu serviço. Com apenas poucos cliques, você pode navegar até o trace relevante e entender melhor o problema.
Como exemplo, vamos usar o mesmo cenário anterior no qual o tempo de transação do serviço Gateway está aumentando apesar de não ter havido implantações recentes no serviço e de não terem sido identificados problemas aparentes com a infraestrutura subjacente.
O componente de distributed traces do APM 360 agiliza a resolução de problemas. Quando você examina o insight sobre distributed trace no resumo do APM, como mostrado na captura de tela a seguir, fica claro que a latência e as taxas de erros do serviço ACME estão afetando o serviço Gateway.
Ao selecionar o serviço relacionado, você pode observar que a latência do serviço ACME downstream teve um pico, afetando diretamente o serviço Gateway. (Veja a captura de tela a seguir.) Para analisar em detalhes o distributed trace, basta selecionar Ver trace.
Com a visão unificada de distributed traces no APM 360, você pode isolar rapidamente os serviços problemáticos e acelerar a resolução de problemas.
Melhore a experiência do usuário com impacto do erro sobre os usuários
O APM 360 vai além das meras métricas de erros e adota a análise do impacto. Com o APM 360, além da taxa de erros, você também pode ver o impacto do erro sobre os usuários, assim, pode identificar e priorizar os erros que causam o maior impacto nos seus usuários e melhorar a experiência geral do usuário do seu aplicativo.
Continuando no cenário de exemplo descrito anteriormente, você observa que o serviço ACME está afetando o desempenho do serviço Gateway. Analisando em mais detalhes o serviço ACME, como mostrado na captura de tela a seguir, você observa que houve um pico na taxa de erros após uma implantação. Com o impacto do erro sobre os usuários, você pode identificar que builtins:TimeoutError
tem o maior impacto sobre os usuários, então, você pode priorizá-lo na resolução de problemas.
Extraia insights mais rapidamente com padrões de log em contexto*
De modo semelhante ao impacto do erro sobre os usuários, os padrões de log são a maneira mais rápida de descobrir valor em dados de log sem ter que fazer pesquisa. A pesquisa pode levar rapidamente a logs que fornecem uma explicação da causa raiz, mas a maioria dos dados é repetitiva e difícil de contextualizar durante a navegação. Os padrões podem facilitar a descoberta de dados de log sem a necessidade de desperdiçar tempo lendo dados de baixo valor.
O APM 360 inclui padrões de log no gráfico de logs além de tipos de log como parte da visualização única, facilitando a detecção da causa raiz de problemas. Na captura de tela a seguir, você pode ver que os 50k de logs capturados para o serviço ACME têm um padrão de cadeia de caracteres GET <*> HTTP 1.1
que não está relacionado a erros de causa raiz no serviço ACME. Assim, você pode seguramente desconsiderar esses logs, concentrando sua atenção em outros mais pertinentes à resolução de problemas.
O APM 360 oferece uma visão unificada de todo o stack que permite a correlação em tempo real do desempenho do aplicativo com tendências upstream e downstream. Essa visibilidade abrangente permite que engenheiros com qualquer nível de conhecimento entendam como os problemas afetam diversos componentes do aplicativo e acelera a resolução de problemas.
Elimine pontos cegos com fluxos de trabalho guiados e recomendações de dados
Para melhorar as práticas de observabilidade, o APM 360 ajuda você a resolver lacunas de monitoramento e migrar para o monitoramento de alta disponibilidade. Ele guia você pelo processo de descoberta de serviços não instrumentados, alertas perdidos, SLOs e vulnerabilidades, garantindo que nenhuma informação importante passe despercebida e você possa identificar problemas que antes desconhecia.
Veja dois cenários nos quais o APM 360 descobre lacunas de monitoramento:
- SLOs perdidos: esta captura de tela destaca a ausência de objetivos de níveis de serviço para o serviço Gateway.
- Lacunas de instrumentação: o APM 360 traz à tona a ausência de instrumentação da infraestrutura dentro do serviço Billing.
Com esses insights, o APM 360 garante que você tenha uma visão abrangente do seu cenário de monitoramento, para que possa resolver deficiências e fortalecer seu framework de observabilidade.
Capacite todos os engenheiros a atingirem excelência
O New Relic APM 360 não faz apenas monitoramento, ele também capacita todos os engenheiros, com qualquer nível de conhecimento, a atingirem a excelência no uso de ferramentas de APM. Proporcionando uma visão abrangente da saúde do serviço e indicadores importantes sobre o aplicativo, o APM 360 fornece os insights necessários para garantir o desempenho e a saúde de seu aplicativo, evitar problemas e causar impacto real nos seus resultados comerciais.
Comece a usar o New Relic APM 360 hoje.
As opiniões expressas neste blog são de responsabilidade do autor e não refletem necessariamente as opiniões da New Relic. Todas as soluções oferecidas pelo autor são específicas do ambiente e não fazem parte das soluções comerciais ou do suporte oferecido pela New Relic. Junte-se a nós exclusivamente no Explorers Hub ( discuss.newrelic.com ) para perguntas e suporte relacionados a esta postagem do blog. Este blog pode conter links para conteúdo de sites de terceiros. Ao fornecer esses links, a New Relic não adota, garante, aprova ou endossa as informações, visualizações ou produtos disponíveis em tais sites.