• 2021년 3월 17일 
 

IT 운영에 인공지능을 사용하는 AIOps가 급부상하고 있지만, 데브옵스(DevOps) 및 사이트 신뢰성 엔지니어링(SRE) 팀은 AIOps의 혜택을 실현하는 데에는 어려움을 겪고 있습니다. 가파른 학습 곡선, 긴 구현 및 교육 시간, 엄청난 비용, 인공 지능 (AI) 및 머신 러닝(ML)에 대한 확신 부족이 이를 가로막고 있기 때문입니다. 상시 호출에 대기하는 엔지니어들은 서비스를 유지하고 운영하는데 방해가 되는 세 가지 도전과제를 지속적으로 언급합니다.

  • 알람이나 정적인 대시보드로는, 변경 사항을 파악하고 새로운 문제와 알려지지 않은 사항을 발견하기가 어렵습니다.

  • 여러 tool에서 알람이 울리고 연속적으로 오류가 발생하는 상황에서, 인시던트를 분류하고 대응 방법을 찾기가 쉽지 않습니다.

  • 왜 문제가 발생했고, 영향 받은 부분을 파악하기 위해 대시보드를 일일이 살펴봐야 하기 때문에, 문제의 근본 원인을 진단하기가 어렵고 시간도 많이 걸립니다.

첨단 상황실을 갖춘 곳은 흔치 않으며, 추측에 의존해 인시던트를 해결할 수는 없습니다. 또한, 문제가 발생했다는 사실을 고객측으로부터 듣고 알아서는 안됩니다. 이런 부분들이 이제, 뉴렐릭의 차세대 응용 인텔리전스(Applied Intelligence)가 출시되어 달라질 것입니다. 응용 인텔리전스는 다음과 같은 혜택을 제공합니다.

  • 비정상적인 변경 사항 즉시 감지: 고객에게 영향을 미치기 전에 애플리케이션, 서비스 및 로그에서 이상 징후를 자동으로 발견해 문제가 발생하는 것을 사전에 방지할 수 있습니다.

  • 알람 노이즈 감소: 모든 소스의 알람 및 이벤트를 상호 연관되고 실행 가능한 문제로 하나의 문제로 그룹화하여, 울려대는 알람을 줄이고, 문제의 우선순위를 보다 쉽게 지정할 수 있습니다.

  • 근본 원인의 신속한 파악: 각 문제의 가능한 근본 원인에 대하여 추측할 필요없이, 자동 인사이트를 통해 문제를 더 신속하게 해결할 수 있습니다. 

  • 인시던트 대응 가속: 응용 인텔리전스를 ITSM tool과 통합하고 모든 것을 동기화 상태로 유지하면, 여러 tool로 인시던트를 관리하는 수고를 덜 수 있습니다.

 

응용 인텔리전스가 무엇을 지원하며, 어떤 점이 새로운지 살펴보겠습니다.

예측하지 못한 변동 사항 즉시 감지

추가 비용이 들지 않는 지속적인 자동 이상 감지

.

응용 인텔리전스는 모든 애플리케이션 및 서비스에서 처리량, 오류 및 레이턴시 같은 황금 신호를 기반으로 이상 징후를 자동으로 감지합니다. 별도의 설정이나 추가 비용 없이, 계측되는 모든 앱과 서비스에서 자동으로 활성화됩니다. 이상 징후가 감지되면, Slack이나 다른 협업 tool을 통해 즉시 알람을 전송하고, 모든 이상에 대힌 실시간 피드와 심층 분석을 제공하여, 더 빠르게 문제를 해결하고 잠재적인 문제가 고객에게 영향을 미치지 않도록 합니다.

[VIDEO INSERT]

 

 

로그 패턴(Log Patterns)

.

이제 응용 인텔리전스에는 머신 러닝을 사용해 패턴을 감지하고, 로그 데이터에서 이상값을 표출해 문제 해결 시간을 단축해주는 새로운 ‘로그 패턴’ 기능이 포함되었습니다. 로그 패턴 기능이 로그 데이터를 자동으로 클러스터링하여 수동 쿼리를 줄여주고, 클릭 한 번으로 수백만 개의 로그 메시지를 탐색할 수 있기 때문에, 수많은 데이터 속에서 비정상적인 패턴과 문제를 빠르게 찾아낼 수 있습니다. 로그 패턴 기능은 현재 공개 베타 버전으로 제공됩니다. 뉴렐릭 계정에서 기능을 활성화하려면, 뉴렐릭의 고객 담당자에게 문의하시기 바랍니다. 

알람 분석

새로운 통합 랜딩 페이지에는 설정된 알람의 성능에 대한 인사이트와 분석이 표시됩니다.

.

반복 알람 음소거 규칙

New Relic Alert의 음소거 규칙에 반복 일정을 지정하면, 예정된 유지보수와 계획된 다운타임 기간 동안 알람이 발생하지 않도록 만들 수 있습니다. 뉴렐릭 UI 또는 API에서, 일별, 주별 또는 월별로 음소거 규칙이 반복 적용되도록 일정을 등록하면 됩니다.

.

알람 노이즈 감소

[INSERT VIDEO]

관계 기반 상호 연관

이제 구성 관리 데이터베이스(CMDB)로부터 얻어진 외부 관계 데이터를 기반으로, 관련된 알람과 이벤트뿐만 아니라 뉴렐릭 엔터티 관계를 연관시킬 수 있습니다. 시간 기반 클러스터링 및 알람 메시지의 컨텍스트를 사용해 알람을 상호 연관시키는 것 외에도, 관계 데이터 저장소의 토폴로지 데이터를 수집해 연결된 서비스에서 발생하는 알람들을 보다 정확하게 연관시킬 수 있습니다. 이를 통해 발생하는 인시던트와 이가 광범위한 환경에 미치는 영향에 대해 더 나은 컨텍스트를 확보하여, 문제의 우선순위를 보다 정확하고 효율적으로 정할 수 있습니다.

.

상관된 문제의 이상 징후

선제적으로 감지된 이상 징후에 모든 소스의 알람 및 이벤트를 연결해 당면한 문제의 전체적인 그림을 확보함으로써, 이해와 조치에 소요되는 시간을 줄일 수 있습니다.

.

상호 연관 도우미를 통해 더 신속한 상호 연관 결정

연관되어야 할 요소들이 연관되지 않았습니까? 상호 연관에 대해 알고는 있지만 어디서부터 시작해야 할지 모르십니까까? 서로 연관되어야 할 인시던트들을 선택하기만 하면, 새로운 상호 연관 도우미 기능이 이를 분석해 인시던트들 간에 어떤 공통점이 있는지를 보여줍니다. 이를 통해, 알람 노이즈를 보다 효과적으로 감소시킬 수 있습니다.  

또한 응용 인텔리전스는 설정을 시뮬레이션하여, 서로 관련된 인시던트들이 어떻게 향후 알람 노이즈를 줄이고 컨텍스트는 늘릴 수 있는지를 실시간으로 보여줍니다.

.

신속한 근본 원인 파악

모든 문제의 가능한 근본 원인 확인

응용 인텔리전스는 자동으로 모든 문제의 가능한 근본 원인에 대해 인사이트를 제공합니다. 미해결된 각 문제의 발생 이유, 문제에 기여한 배포 버전, 관련 오류 로그 및 속성을 신속하게 확인할 수 있기 때문에, 그 어느 때보다 빠르게 문제를 조사할 수 있습니다. 응용 인텔리전스는 수집된 이벤트 데이터 내의 모든 속성 분포를 검토하고, 분포에서 중요한 변경 사항을 찾아 가능한 원인을 표면화시킵니다. 예를 들어, 생성된 각 트랜잭션 이벤트를 스캐닝하여, 단일 사용자의 요청이 앱으로 전송된 요청에서 비정상적인 부분을 차지하는지를 확인할 수 있습니다.

.

또한 근본 원인 분석이 오류, 트래픽, 레이턴시, 포화 같은 황금 신호를 기반으로 문제를 자동으로 분류해주기 때문에, 문제가 발생한 이유를 빠르게 파악할 수 있습니다.

[INSERT VIDEO]

인시던트에 대한 신속한 대응

서로 연관된 문제들을 위한 ServiceNow와의 양방향 통합

PagerDuty와의 기존 양방향 통합 이외에도, ServiceNow 인시던트가 통합되었습니다. 이제 상호 연관된 문제의 상태를 응용 인텔리전스와 양방향으로 동기화하여 여러 tool로 인시던트를 관리하는 수고를 덜 수 있습니다. 어느 한 플랫폼에서 상호 연관된 문제의 상태가 변경되면, 두 tool 모두에서 상태가 자동으로 업데이트됩니다. 응용 인텔리전스는 VictorOps, OpsGenie 및 기타 tool과의 통합을 지원하는 웹훅도 지원합니다.

.

뉴렐릭 알람 위반에 대해 응답자 제안 

문제에 가장 잘 대응할 수 있는 팀원을 자동으로 추천해줍니다. 해당 구성 요소의 오류에 대한 전문 지식을 보유하고 있거나 유사한 문제를 해결한 적이 있는 팀원이 추천됩니다. 이 개선 사항은 PagerDuty 인시던트 데이터를 기반으로 응답자를 추천하는 기존 지원을 기반으로 하여, 뉴렐릭 알람을 위반해 비롯된 문제에 대한 응답자를 제안합니다. 이 기능은 완전하게 자동으로 이루어지며, 별도의 설정이나 모델 교육이 필요하지 않습니다. 뉴렐릭이 팀 응답자들의 행동방식을 통해 학습을 하기 때문에 바로 사용할 수 있습니다.

.

시작 방법

뉴렐릭 응용 인텔리전스를 사용 중인 고객은, 추가 비용 없이 새로운 기능에 액세스할 수 있습니다.

구현된 뉴렐릭에 AIOps 기능을 추가하는 데 관심이 있는 고객은 뉴렐릭 계정에서 "Alerts & AI" 링크를 클릭하면 바로 시작할 수 있습니다.

뉴렐릭을 처음 접하며, 더욱 자세한 정보를 원하는 고객은 영구 무료 계정을 신청하여, New Relic One의 간단함을 직접 경험해보고, 뉴렐릭 응용 인텔리전스의 다양한 혜택을 확인해보시기 바랍니다.