기존 근본 원인 분석(RCA) 프로세스는 원인보다는 증상에 초점을 맞추고 중요한 인과 관계 추론 엔진이 없기 때문에 본질적인 결함이 존재합니다. 이러한 비효율성으로 인해 엔지니어는 연관점을 찾기 위해 메트릭, 로그 및 트레이스를 수동으로 검색하는 데 수많은 시간을 소비하게 되고, 결국 불필요하게 평균 문제 해결 시간이 늘어납니다.

오늘날의 옵저버빌리티 툴은 알림을 제공하지만 인시던트의 실질적인 원인을 정확히 파악하지 못합니다. 보편적으로 사용되는 상호 연관 방식은 증상에서 실제 원인을 식별하지 못하는 경우가 많습니다. 정확하지 못하다 보니 사용자의 확신은 낮아질 수 밖에 없고 전체 인시던트 해결 워크플로우는 한층 더 복잡해 집니다.

오늘 뉴렐릭 어드밴스(New Relic Advance) 이벤트에서 프리뷰 버전으로 발표된 지능형 근본 원인 분석(iRCA)은 토폴로지 그래프, 고급 인과 모델, 경로 기반 순위 알고리즘을 활용해 몇 시간이 아닌 몇 초 만에 가능성 있는 근본 원인을 신속하게 파악합니다.

정밀하게 근본 원인 파악

상호 연관에 기반한 많은 접근 방식과 달리, 뉴렐릭 iRCA는 관찰된 증상을 실시간 토폴로지 그래프에 오버레이한 후 인과 관계 모델과 순위 알고리즘을 적용합니다. 이를 통해 가능성 있는 근본 원인을 연쇄 효과와 구별함으로써 오탐률과 노이즈를 줄여줍니다.

또한 자동화된 완화 후크를 통해, 사후 대응에서 선제적이고 자율적인 운영으로 옵저버빌리티를 전환합니다.

  • 문제 예측 및 예방: 그래프 기반 인과 추론과 확률적 모델을 활용해 근본 원인을 정확히 찾아내어 평균 해결 시간 대폭 감소
  • 시스템 복잡성 해결: 복잡한 멀티 클라우드 환경에서 전체 RCA 범위를 지원하는 실시간 토폴로지 그래프 구축
  • 옵저버빌리티와 비즈니스 영향 연결: 정확도가 높은 RCA로 고객 이탈을 줄이고 고객 경험을 개선하며 엔지니어링 생산성 향상

기존 RCA를 뛰어 넘는 역량

iRCA가 비즈니스에 미치는 즉각적인 영향:

역량영향
더 빠른 해결가능성 있는 근본 원인을 몇 초 내에 빠르고 정확하게 자동으로 찾아내어 평균 해결 시간(MTTR)을 크게 줄여줍니다.
선제적 복원력자동화된 완화 후크로 문제를 예측 및 예방하고 옵저버빌리티를 활용해 운영을 사후 대응에서 선제적이고 자율적인 체제로 전환합니다.
완전한 가시성증가하는 모든 시스템과 데이터를 자동으로 파악합니다. iRCA는 복잡한 멀티 클라우드 이기종 환경에서 실시간 토폴로지 그래프를 생성하여 완전한 RCA 범위를 보장합니다.
비즈니스 정렬높은 정확도와 빠른 RCA는 고객 이탈 감소, 고객 경험 향상, 엔지니어링 팀의 생산성 향상 등 긍정적인 비즈니스 성과로 직결됩니다.

결론: 인시던트 대응 혁신

비즈니스 혜택

iRCA의 역량

운영 비용 대폭 절감

신속한 해결 및 선제적 복구 기능을 통해, 엔지니어링 및 운영 팀이 수동 조사 및 인시던트 대응에 소비하는 시간과 비용을 크게 줄여 줍니다.

시스템 안정성 및 고객 경험 개선

완전히 표면화되기 전에 장애를 예상 및 해결하여 다운타임을 줄이고 서비스 가용성과 고객 만족도를 높일 수 있습니다.

팀의 생산성 및 집중력 향상

수동 로그 분석, 툴 간 전환, 오탐에 대한 분석이 불필요해져 귀중한 엔지니어링 시간이 절약되어, 팀은 사후 대응 작업이 아니라 혁신과 기능 개발에 시간을 더 할애할 수 있습니다.