차세대 AIOps: 확장된 이상 감지, 이슈 맵 등

Published 5분 소요
한 손으로 흰색 체크 표시를 들고 다른 손으로 렌치를 들고 있는 로봇이 있는 청록색 전경과 파란색 배경

문제가 발생한 경우, 그 소식을 고객으로부터 전해 듣는 일은 절대 없어야 합니다. 이상적으로는, 고객이 영향을 받기 전에 문제를 감지하고 수정해야 합니다. 그러나 상황이 여의치 않는다면, 고객이 연락해왔을 때 적어도 이미 문제를 해결하고 있다고 말할 수 있도록 필요한 문맥과 분석 정보를 보유하고 있어야 합니다.

시스템들은 그 어느 때보다 복잡하고, 팀원들은 우리 모두와 같이 인간일 뿐 입니다. 다행스럽게도, 머신 러닝(ML)과 인공 지능(AI)을 활용해, 문제를 발생 지점에서 더 빠르게 감지, 진단 및 완화하는 것이 가능해졌습니다.

올해의 FutureStack 2021에서 뉴렐릭은 IT 운영에 AI와 ML을 적용하는 AIOps 분야의 혁신을 다수 발표했습니다. 이슈 맵, 인시던트 분석 등 기업과 팀들이 더 스마트하고 쉽게 문제를 감지하며, 향상된 분석으로부터 혜택을 누릴 수 있도록 해주는 몇 가지 툴(tool)을 소개합니다.

지능형 감지

확장된 이상 감지

이제 확장된 이상 감지의 제한적 릴리스를 사용해, 뉴렐릭의 거의 모든 엔터티에서 몇 번의 클릭만으로 이상을 감지할 수 있습니다.

알람 및 AI 대시보드의 이상 데이터

이제 뉴렐릭의 룩아웃(New Relic Lookout)워크로드(Workloads)를 통해, 모든 범위의 엔터티에 이상 감지를 신속하게 적용함으로써, APM에서 이상을 감지하는 것 이외의 혜택을 누릴 수 있습니다. 이를 통해, 이슈가 되기 전에 거의 모든 곳에서 문제를 발견할 수 있습니다.

이미 이상 감지를 설정해 놓은 경우에도 걱정할 필요가 없습니다. 기존 설정은 영향을 받지 않기 때문입니다. 또한, 확장된 이상 감지 기능은 이상을 감지하는 알고리즘을 더 세부적으로 제어하고 필요에 따라 맞춤화할 수 있습니다.

더 빠르고 간편하며 확장된 이상 감지 기능을 통해, 평균 감지 시간(MTTD)을 대폭 줄일 수 있습니다.

확장된 이상 감지를 시작하려면 여기를 클릭해 계정을 신청하십시오.

더 스마트하고 쉬워진 알람

비즈니스 서비스와 인프라는 지속적으로 변화하고 있습니다. 이제 개별 서비스의 예상 성능을 파악하고 수동으로 정적인 임계값을 지정할 필요없이, 모든 서비스 및 인프라를 포괄하는 알람 조건 기준을 쉽게 생성하고, 동적인 임계값을 사용할 수 있습니다. 이러한 동적 임계값은 비즈니스에서 예상되는 유동성과 변동성을 반영해 조정됩니다.

뉴렐릭은 각 신호별로 설정해야 했던 기존의 동적 기준 알람을 확장하여, 하나의 알람 설정이 특정 서비스 또는 엔터티와 관련된 최대 5,000개의 시계열에 동적 임계값을 적용할 수 있도록 만들었습니다. 덕분에, 팀이 모든 엔터티에 알람 적용 범위를 훨씬 쉽게 추가할 수 있습니다. 모든 팀이 적극적으로 나서서 인시던트에 대응할 수 있어야 합니다.

정적 임계값을 설정한다는 것은 많은 엔지니어들에게 결코 쉽지 않은 일입니다. 다행히도, 모든 서비스와 인프라를 포괄하는 동적 기준 알람 조건을 쉽게 만들 수 있습니다. 사용 중인 NRQL 쿼리에 ‘FACET’ 절을 추가한 다음, 모니터링할 신호를 구분해주는 메타데이터 속성을 지정하기만 하면 됩니다. 마지막으로, 사용자 인터페이스의 슬라이더를 이동하여 민감도를 설정하고 조정할 수 있습니다.

패싯된 기준 조건에 대해 자세히 보기

신속한 근본 원인 파악

이슈 맵

뉴렐릭의 어플라이드 인텔리전스(Applied Intelligence)는 관련된 인시던트를 조치를 취할 수 있는 하나의 문제로 연관시키고, 문제를 신속하게 이해하고 완화하는 데 필요한 컨텍스트로 강화하여, 알람 피로를 줄여줍니다. 이 기능의 중요한 부분은 관련된 모든 문제를 목록으로 보여주는 이슈 페이지입니다.

이슈 페이지에서 문제를 선택하면, 문제에 대한 심층 분석 및 개요 페이지로 이동합니다. 이슈 뷰는 문제의 개요로 시작해 세부적인 정보를 제공하는 방식을 사용합니다. 가능한 근본 원인 같은 추가 정보는 페이지 아래로 내려가면 추가적인 컨텍스트가 있습니다.

이슈 뷰의 일부인 이슈 맵은 영향을 받는 엔터티를 시각화해 보여줍니다. 이슈 맵은 엔터티들이 상호 연결된 방식을 보여 주기 때문에, 관련된 엔터티가 조용히 오작동하고 있는지, 인접 엔터티가 위험에 처했는지, 또는 다운스트림 엔터티 영향을 받는지를 빠르게 이해할 수 있습니다.

이슈 맵은 해당되는 경우 업스트림 및 다운스트림 엔터티를 표시하여, 당면한 문제의 범위와 잠재적 영향을 더 효과적으로 보여줍니다. 또한, 서비스가 실행되는 호스트 같은 풀 스택 및 데브옵스 컨텍스트는 물론 소유자, 지역 및 환경 같은 필수 태그를 강조합니다.

이슈 맵은 상호 작용도 가능하며, New Relic One에 밀접하게 통합됩니다. 엔터티를 클릭하면, 엔터티 개요가 열립니다. 엔터티 위로 마우스를 가져가면, 새로운 종속성 뷰를 열 수 있습니다. 이 뷰는 완전한 컨텍스트를 제공하며, 대량 태깅 및 워크로드 추가할 수 있는 워크플로우를 활성화합니다.

영향을 받는 엔터티 맵에 대해 자세히 보기

인시던트 분석

뉴렐릭의 어플라이드 인텔리전스(Applied Intelligence)는 가능한 근본 원인을 자동으로 표시해줍니다. 이제 특정 신호에 대한 자동 분석을 통해, 문제를 구성하는 개별적인 인시던트를 면밀하게 조사할 수 있습니다. 문제가 있는 쿼리, 오류 분석, 코드 레벨 스택 트레이스 및 외부 서비스 호출 분석에 대한 링크가 포함된 데이터스토어를 분석하면, 문제를 더 쉽고 빠르게 조사하고 진단할 수 있습니다.

관련 대시보드

대부분의 기업과 팀들은 커스텀 대시보드를 만들어 옵저버빌리티(observability)를 맞춤화하는 데 이미 투자를 했을 것입니다. 이제 추가적인 설정을 하지 않아도, 팀이 생성한 대시보드와 가장 관련된 대시보드가 추천됩니다. 필요한 정보를 제공할 대시보드를 파악하는 대신, 추천된 대시보드를 사용해 문제를 해결하는 데 필요한 컨텍스트를 즉각적으로 얻을 수 있습니다. 더 많이 사용하면 할수록, 추천 역량은 향상됩니다.

알람 및 어플라이드 인텔리전스 문서에서 이슈 요약에 대해 자세히 보기

뉴렐릭을 처음 사용하는 경우, 영구 무료 계정을 신청하여 New Relic One의 간단함을 직접 경험해보시기 바랍니다. 뉴렐릭의 AIOps에 대한 보다 자세한 정보는 알람 및 어플라이드 인텔리전스 문서를 확인하십시오.