Como monitorar os aplicativos de IA desenvolvidos com o NVIDIA NIM

Os aplicativos de IA generativa desenvolvidos por grandes modelos de linguagem (large language models, LLMs) têm um imenso potencial em várias indústrias. Entretanto, construir, implantar e monitorar esses modelos poderosos é uma tarefa complexa. Foi aí que a NVIDIA e a New Relic juntaram forças para fornecer um caminho simplificado para o desenvolvimento, implantação e monitoramento de aplicativos empresariais com tecnologia de IA na produção.

O NVIDIA NIM, parte da empresa NVIDIA AI, é um conjunto de microsserviços nativos na nuvem que oferecem modelos como contêineres otimizados. Esses contêineres podem ser implantados em nuvens, data centers ou estações de trabalho, permitindo a fácil criação de aplicativos de IA generativa como copilotos e chatbots.

O AI Monitoring da New Relic se integra perfeitamente com o NVIDIA NIM, oferecendo uma observabilidade full-stack para aplicativos desenvolvidos em uma ampla gama de modelos de IA apoiados pelo NIM, incluindo Llama 3 da Meta, Mistral Large e Mixtral 8x22B, entre outros. Essa integração ajuda as organizações a implantar e monitorar com confiança os aplicativos de IA desenvolvidos com o NVIDIA NIM, acelerar o tempo de entrada ao mercado e aprimorar o ROI.

O que é o NVIDIA NIM?

O NVIDIA NIM é um conjunto de microsserviços de inferência que oferece modelos de LLM otimizados e pré-desenvolvidos que simplificam a implantação na infraestrutura acelerada da NVIDIA no data center e na nuvem. Isso elimina a necessidade das empresas de gastarem tempo e recursos valiosos otimizando modelos para funcionarem em diferentes infraestruturas, criando APIs para desenvolvedores construírem aplicativos e mantendo a segurança e o suporte para esses modelos na produção. Veja aqui como o NIM combate os desafios da IA generativa:

Modelos otimizados e pré-desenvolvidos: o NIM oferece uma biblioteca de modelos de LLM pré-treinados, economizando a expertise e o esforço necessários para o desenvolvimento dos modelos. Esses modelos são especificamente otimizados para os NVIDIA GPUs, garantindo um desempenho eficiente.
Implantação simplificada: o NIM utiliza microsserviços em contêineres, facilitando a implantação. Essas unidades pré-empacotadas incluem tudo o que é necessário para que o modelo funcione, permitindo uma implantação rápida e fácil em diversas plataformas, desde ambientes em nuvem a data centers físicos.
Segurança aprimorada: para aplicativos que requerem uma segurança robusta, a opção de implantação de modelo auto-hospedado do NIM oferece um controle completo dos seus dados.

Começando com o AI Monitoring da New Relic para NVIDIA NIM

O AI Monitoring da New Relic oferece o poder da observabilidade a toda a stack de IA para aplicativos desenvolvidos com o NVIDIA NIM. Isso permite que você monitore facilmente, resolva bugs e otimize seus aplicativos de IA para desempenho, qualidade e custo, enquanto assegura a privacidade e a segurança dos dados. Aqui está um passo a passo das instruções que o ajudarão a iniciar o monitoramento dos aplicativos de IA desenvolvidos com o NVIDIA NIM

Etapa 1: Defina a instrumentação do seu aplicativo de IA desenvolvido com o NVIDIA NIM

Primeiro, você precisa definir a instrumentação para o seu aplicativo. Veja como:

Obtenha uma conta gratuita na New Relic ou faça o login se você já tiver uma conta.
Clique em Add Data.
Na barra de pesquisa, digite NVIDIA e selecione NVIDIA NIM.

Escolha a linguagem de programação (Python, Node.js) do seu aplicativo.
Siga o processo de integração guiado fornecido pela New Relic. Esse processo vai orientá-lo sobre a instrumentação do seu aplicativo de IA desenvolvido com o NVIDIA NIM. Chamamos o nosso exemplo de aplicativo de "local-nim".

Etapa 2: Acesse o AI Monitoring

Uma vez que seu aplicativo for instrumentado, você pode começar a usar o AI Monitoring:

Navegue até All Capabilities no seu dashboard da New Relic.
Clique em AI Monitoring.

Na seção AI Monitoring, em All Entities, você verá o exemplo de aplicativo "local-nim" que desenvolvemos usando o NVIDIA NIM.

Clique no aplicativo local-nim para acessar o resumo do APM 360 com a visualização integrada do AI Monitoring. Essa visualização unificada dá a você insights instantâneos das principais métricas das camadas da IA, tais como o número total de pedidos, tempo médio de resposta, uso de token e taxas de erros de resposta. Esses resultados aparecem no contexto, junto com os sinais clássicos de APM, insights de infraestrutura e logs. Ao correlacionar todas essas informações em um só lugar, você pode identificar rapidamente a fonte dos problemas e se aprofundar ainda mais nas análises.

Visualização do resumo do APM 360 mostrando a visualização de métricas integradas de resposta da IA.

Etapa 3: Mergulhe fundo com o monitoramento de resposta da IA

Para uma análise mais detalhada, a visualização de monitoramento profundo é extremamente útil:

No resumo do APM 360, clique na navegação AI responses no lado esquerdo e selecione a resposta na qual você quer se aprofundar.

Aqui, você pode ver todo o caminho, desde a inserção inicial do usuário até a resposta final, incluindo metadados como contagem de token, informações do modelo e interações dos usuários reais. Isso permite que você chegue à raiz do problema rapidamente.

Etapa 4: Explore o inventário de modelos

O inventário de modelos fornece uma visão abrangente do uso dos modelos em todos os seus serviços e contas. Isso ajuda você a isolar o desempenho, os erros e os problemas de custo relacionados aos modelos.

Volte para a seção AI Monitoring.
Clique em Model Inventory e visualize o desempenho, os erros e as métricas de custo para cada modelo

Etapa 5: Compare modelos e faça a escolha ideal

Para escolher o modelo que melhor se encaixa nos seus custos e necessidades de desempenho:

Clique em Compare Models
Selecione os modelos, o serviço e a faixa de tempo que você quer comparar na lista do menu suspenso

Etapa 6: Melhore a privacidade e a segurança

Para complementar a vantagem robusta de segurança dos modelos auto-hospedados do NVIDIA NIM, a New Relic permite que você exclua o monitoramento de dados sigilosos (PII) em seus pedidos e respostas de IA:

Clique em Drop Filters e crie filtros voltados para os tipos de dados específicos dentro dos seis eventos oferecidos.

Acelerar a IA na produção com a New Relic e a NVIDIA

O AI Monitoring da New Relic e o NVIDIA NIM oferecem uma solução compacta para organizações que buscam acelerar a IA na produção. Aproveitando-se dos modelos pré-desenvolvidos, da implantação simplificada e do monitoramento abrangente, as empresas podem fornecer aplicativos de IA generativa de alto desempenho mais rapidamente, resultando em uma economia de custos significativa e um caminho mais rápido para ROI. Essa colaboração marca um avanço significativo no acesso democrático à IA e seu potencial transformador.

Obtenha uma conta gratuita na New Relic e comece com o monitoramento dos seus aplicativos NVIDIA NIM hoje mesmo.

Por Lavanya Chockalingam, Gerente de marketing de produto principal

Lavanya Chockalingam é gerente de marketing de produto principal na New Relic. Lavanya começou a carreira como engenheira e, em seguida, assumiu funções de vendas e marketing de produto. Lavanya trabalhou em setores de hardware e de software e é apaixonada por tecnologia e como pode ser aproveitada para resolver problemas do mundo real.

As opiniões expressas neste blog são de responsabilidade do autor e não refletem necessariamente as opiniões da New Relic. Todas as soluções oferecidas pelo autor são específicas do ambiente e não fazem parte das soluções comerciais ou do suporte oferecido pela New Relic. Junte-se a nós exclusivamente no Explorers Hub ( discuss.newrelic.com ) para perguntas e suporte relacionados a esta postagem do blog. Este blog pode conter links para conteúdo de sites de terceiros. Ao fornecer esses links, a New Relic não adota, garante, aprova ou endossa as informações, visualizações ou produtos disponíveis em tais sites.

Como monitorar os aplicativos de IA desenvolvidos com o NVIDIA NIM

780+ integrações para começar a monitorar seu stack gratuitamente.

Veja as integrações

In this article

Como monitorar os aplicativos de IA desenvolvidos com o NVIDIA NIM

O AI Monitoring da New Relic oferece insights mais detalhados por toda a stack de aplicativos de IA desenvolvidos com o NVIDIA NIM

O que é o NVIDIA NIM?

Começando com o AI Monitoring da New Relic para NVIDIA NIM

Acelerar a IA na produção com a New Relic e a NVIDIA

Tags

Relacionados