Gerenciar stacks de tecnologia complexos e garantir tempo de operação contínuo são desafios cruciais para equipes de engenharia modernas. Reagir aos problemas depois que eles ocorrem geralmente resulta em período de inatividade dispendioso e clientes frustrados. A solução? Monitoramento proativo de desempenho. Com o New Relic AI, você pode passar do monitoramento reativo para o proativo, aproveitando a IA para prever problemas antes que eles aconteçam, identificar tendências e resolver problemas com mais rapidez.
O New Relic AI é o primeiro assistente de observabilidade com IA generativa que combina os principais grandes modelos de linguagem (LLMs) com a plataforma de dados New Relic para compreender tanto o seu sistema como a própria plataforma New Relic, fornecendo insights mais aprofundados sobre uma grande quantidade de dados de telemetria usando linguagem cotidiana.
Nesta publicação do blog, você aprenderá como usar o New Relic AI para:
- Analisar tendências de desempenho
- Identificar anomalias
- Detectar lacunas de monitoramento
- Configurar monitores sintéticos
Introdução ao NRAI
Embora atualmente seja uma versão prévia, o NRAI é simples de ativar. Para começar, clique em Ask AI (Perguntar à IA) no canto superior direito de qualquer página e depois clique em Get started (Começar).
Será solicitado que você revise os Termos Específicos da IA Generativa. Caso você não tenha aceitado anteriormente a política de pré-lançamento do New Relic, será solicitado que você a revise aqui. Clique em Accept (Aceitar). Uma vez feito isso, você verá uma janela de chat.
Agora você pode interagir com o assistente de IA para ajudar a monitorar e solucionar problemas do seu sistema.
Analise tendências de desempenho
O monitoramento proativo começa com a compreensão do desempenho histórico dos seus serviços. Ao analisar tendências ao longo do tempo, você pode identificar áreas que precisem de atenção antes que se tornem problemas maiores.
Para começar, você pode pedir ao NRAI para fazer um resumo do desempenho de um serviço específico durante um período determinado.
Como foi o desempenho do serviço de catálogo na última hora?
O NRAI recuperará métricas de desempenho relevantes, incluindo transações, duração média e taxas de erro, fornecendo uma visão geral rápida da integridade do serviço, conforme mostrado no exemplo abaixo.
No exemplo acima, o NRAI mostra o desempenho do serviço de catálogo, incluindo transações, duração média e taxa de erro. Você também pode pedir ao NRAI para se concentrar em uma métrica específica, como a taxa de erros.
Houve algum erro neste serviço?
O NRAI é capaz de manter o contexto e entende que você deseja recuperar os erros de transação no "catalogue-service" (serviço de catálogo) das últimas horas. Ele converte a linguagem natural em uma consulta New Relic Query Language (NRQL) e indica se houve algum erro no seu serviço.
Além disso, você pode solicitar uma explicação detalhada desses erros e também investigar suas causas subjacentes.
Aqui, o New Relic AI mostra a lista de todos os erros no catalogue-service
juntamente com todos os atributos associados. Você pode entrar em mais detalhes sobre cada erro. É só uma questão de fazer a pergunta certa.
Outro ponto interessante a ser observado é que as métricas mostradas como parte da análise de desempenho variam dependendo do serviço específico que está sendo analisado. Por exemplo:
Como está o desempenho do serviço de frontend nas últimas 24 horas?
Agora que estamos perguntando sobre um aplicativo do navegador, o NRAI recupera as métricas relacionadas ao aplicativo do navegador.
No exemplo acima, o NRAI recupera a duração média do frontend, a primeira renderização de conteúdo média e as métricas da primeira renderização média nas últimas 24 horas.
Para garantir estabilidade a longo prazo, você pode comparar o desempenho em diferentes períodos de tempo. Isso ajuda a destacar tendências que podem sinalizar problemas futuros.
Como o desempenho do serviço de frontend nas últimas 24 horas se compara ao da última semana?
Com isso, nosso assistente com IA generativa ajudará você a ver se o desempenho está diminuindo gradualmente ou se os picos estão se tornando mais frequentes, o que pode indicar problemas mais profundos.
Neste exemplo, a duração média do frontend melhorou 2%, o que mostra uma melhoria geral.
Identificando anomalias
Depois de analisar as tendências de desempenho, o próximo passo no monitoramento proativo é identificar anomalias: padrões ou comportamentos incomuns que podem indicar um problema. Basta pedir ao NRAI para destacar anomalias recentes. Você pode começar pedindo ao New Relic AI para detectar qualquer atividade incomum ou picos em métricas importantes, como taxas de erro, tempos de resposta ou até mesmo uma visão geral de anomalias em seu stack.
Houve alguma anomalia em algum dos meus serviços nas últimas 24 horas?
Depois de fazer uma varredura do seu stack, o NRAI relatará quaisquer anomalias em seus serviços, como picos repentinos, diminuição de operações de E/S, taxas de erro ou outros padrões irregulares.
No exemplo acima, o New Relic AI detectou duas anomalias:
- Diminuição nas operações de leitura e gravação
- Aumento no tempo de gravação
Ele também especifica o contexto das anomalias e mostra etapas executáveis para resolver quaisquer problemas de desempenho relacionados.
Configure monitores sintéticos
O monitoramento sintético simula interações do usuário com seus aplicativos para detectar possíveis problemas antes que eles afetem usuários reais. Por exemplo, o NRAI pode ajudar você a configurar um monitor sintético que testa a disponibilidade dos seus serviços em intervalos regulares. Isso garante que qualquer degradação de desempenho seja detectada com antecedência.
Para começar, você pode pedir recomendações de monitoramento sintético ao New Relic AI.
No exemplo acima, o NRAI verifica o stack para identificar as entidades com anomalias e sugere a configuração de monitores sintéticos. Por padrão, o NRAI cria verificações de ping para seus serviços e aplicativos. No entanto, ele pode orientar você a configurar um monitor sintético mais avançado, como um navegador com script ou um teste de API. Esses tipos de monitores permitem simular interações do usuário ou chamadas de API para garantir que seu aplicativo não apenas esteja acessível, mas também funcionando corretamente.
Ao configurar monitores sintéticos, você pode detectar problemas antes que eles afetem usuários reais, garantindo uma experiência tranquila a todos que interagem com seus serviços.
Detecte lacunas de monitoramento
Uma parte crucial do monitoramento proativo é garantir que todo o seu stack esteja coberto por alertas e ferramentas de monitoramento. A falta de cobertura em áreas-chave pode significar a possibilidade de ser surpreendido por problemas. Para identificar serviços não monitorados, você pode começar pedindo ao assistente para encontrar as lacunas no seu stack. Ou, mais especificamente, você também pode perguntar sobre áreas em seu stack que não estão atualmente cobertas por alertas.
Mostre-me todas as entidades que não são cobertas por um alerta.
Ou você também pode pedir ao NRAI para encontrar lacunas de cobertura em seu stack.
Você consegue encontrar a lacuna de cobertura no meu stack?
O prompt acima provavelmente gerará uma lista de entidades que não são cobertas por alertas, garantindo que você saiba quais partes do seu sistema requerem mais atenção para notificar as equipes sobre problemas contínuos.
Conforme sugerido no exemplo, você pode restringir sua pesquisa especificando o tipo de aplicativo no qual deseja se concentrar.
Os exemplos acima mostram a lista de serviços de monitoramento do desempenho de aplicativos (APM) que não são cobertos por condições de alerta. Depois de identificar essas lacunas, você pode priorizar a configuração de alertas para os serviços mais críticos primeiro. Você também pode dar um passo adiante e pedir recomendações ao New Relic AI sobre quais alertas devem ser configurados com base em incidentes anteriores.
Isso garante que seus serviços mais essenciais sejam sempre monitorados, ajudando a evitar que problemas significativos passem despercebidos.
Conclusão
O New Relic AI transforma a maneira como você monitora seu stack, facilitando a detecção de problemas antes que eles se agravem. Ao usar o assistente viabilizado por IA para alertas, análise de tendências, investigação de erros e configuração de monitores sintéticos, você pode transformar o monitoramento reativo em proativo, garantindo operações mais tranquilas e menos incidentes.
Próximos passos
A IA generativa mudou quase tudo no setor de observabilidade e adotá-la é o único caminho possível. Quando estiver pronto:
- Cadastre-se gratuitamente na New Relic para explorar seus recursos, incluindo o New Relic AI, e começar a analisar seus dados de desempenho.
- Para uma visão geral completa e um guia de configuração, confira a documentação oficial sobre como começar a usar o New Relic AI.
- Entenda como o New Relic AI traduz linguagem natural para NRQL para obter insights rápidos.
As opiniões expressas neste blog são de responsabilidade do autor e não refletem necessariamente as opiniões da New Relic. Todas as soluções oferecidas pelo autor são específicas do ambiente e não fazem parte das soluções comerciais ou do suporte oferecido pela New Relic. Junte-se a nós exclusivamente no Explorers Hub ( discuss.newrelic.com ) para perguntas e suporte relacionados a esta postagem do blog. Este blog pode conter links para conteúdo de sites de terceiros. Ao fornecer esses links, a New Relic não adota, garante, aprova ou endossa as informações, visualizações ou produtos disponíveis em tais sites.