Resumo
Varejistas, bancos, gigantes do streaming e inúmeras outras empresas dependem da New Relic como seus "olhos e ouvidos" essenciais para oferecer experiências confiáveis em larga escala. Elas recorrem a nós em seus momentos mais críticos — lançamentos de novos produtos ou grandes eventos de streaming — observando o aumento do tráfego nos dashboards da New Relic e confiando nos alertas para sinalizar comportamentos anormais ou erros. Nós entendemos a extrema importância da observabilidade em larga escala porque, como engenheiros, vivemos e respiramos esses desafios diariamente.
Este artigo ilustrará, através de exemplos concretos, como nossa organização de engenharia usa nosso próprio produto diariamente para atingir um amplo conjunto de objetivos de negócios críticos, desde uma economia significativa nos custos na nuvem e o aumento da produtividade dos desenvolvedores até a melhoria contínua da experiência do cliente e a conservação de um tempo de operação elevado.
A organização de engenharia da New Relic depende exclusivamente de sua própria plataforma de observabilidade para manter um tempo de operação incomparável e baixa latência. Essa autoinstrumentação, ou New Relic na New Relic, é crucial para gerenciar a plataforma em larga escala, coletando mais de um trilhão de pontos de dados e executando mais de 20 milhões de consultas diariamente, tudo isso enquanto reduz significativamente os custos operacionais.
Como criadores e usuários da plataforma New Relic, desenvolvemos soluções para nossas necessidades complexas de observabilidade, e esses aprendizados refinam diretamente os recursos do produto voltados para o cliente. Essa abordagem “de dentro para fora” garante que a New Relic atenda às demandas de sistemas modernos e distribuídos.
Exploraremos vários casos de uso detalhando como nossas equipes internas — SRE, frontend, backend, engenharia de plataforma, rede e outras — alcançam excelência operacional e inovação por meio da observabilidade abrangente.
Exploraremos os três principais pilares da nossa estratégia de confiabilidade:
- Medir o que importa: entendendo e monitorando as métricas essenciais para um desempenho confiável e resolução de problemas eficiente a fim de atingir objetivos de negócios.
- Sistemas autorreparáveis: reduzindo o esforço dos engenheiros e melhorando a confiabilidade usando automação para prevenir e responder a possíveis problemas.
- Mitigar problemas rapidamente: equipando nossas equipes com ferramentas e insights para diagnosticar e resolver problemas rapidamente quando eles surgirem.
Através desta visão geral, você terá uma compreensão mais profunda do compromisso da New Relic com a auto-observabilidade, que não apenas garante o desempenho confiável dos ambientes de nossos clientes, mas também aprimora e valida continuamente a plataforma na qual eles confiam. Esta é a nossa história de inovação e excelência em engenharia, e a confiança inabalável — respaldada pela nossa própria experiência diária — que advém das operações com a New Relic.