Alertas são importantes para responder rapidamente a interrupções de serviço potenciais. No entanto, alertar um respondente de incidentes para tomar uma ação manual ainda consome tempo. É por isso que a New Relic automatiza o máximo possível, com foco em sistemas autorreparáveis.
O dimensionamento automático reduz o trabalho de engenharia
A New Relic investiu significativamente em algoritmos de dimensionamento automático que pode ampliar ou reduzir rapidamente os serviços. Esses algoritmos usam métricas como CPU e memória para realizar aumentos e diminuições da escala. Isso reduziu significativamente as interrupções e as notificações recebidas pela equipe. Por exemplo, não era incomum que nossa Equipe de Logging fosse acionada de 2 a 4 vezes por semana para ajudar a escalar um serviço. Após implementar o dimensionamento automático, a equipe recebe significativamente menos notificações.
Reversão automática para confiabilidade
Embora os serviços da New Relic passem por uma série de verificações antes de serem implantados na produção, às vezes os bugs chegam à produção. Nesses casos, a New Relic emprega a reversão automática do serviço. Quando uma alteração é implantada por meio do pipeline de implantação contínua da New Relic, um fluxo de trabalho é iniciado para monitorar a integridade da entidade. Se o serviço ficar com problemas, o fluxo de trabalho acionará o pipeline de implantação contínua para reverter as instâncias com problemas.