전 세계의 엔지니어링 및 IT 리더 1,700명을 대상으로 실시한 설문 조사 결과를 토대로 작성된 뉴렐릭의 제5차 연례 옵저버빌리티 전망(Observability Forecast) 보고서가 발표되었습니다. 이 보고서는 다가오는 기술 시대에서 성공을 판가름해줄 기능, 비즈니스 성과, 운영 상의 도전과제를 살펴봅니다.
지능형 옵저버빌리티와 AI의 부상
AI가 일상의 모든 일에 내장되면서 기술의 세상에는 중대한 변화의 물결이 일고 있습니다. 새로운 시대는 기본적인 모니터링에서 벗어나 지능형 옵저버빌리티로 이동할 것을 요구합니다. 이는 숙련된 엔지니어부터 IT 비전문가에 이르기까지 누구나 애플리케이션을 신속하게 구축 및 배포할 수 있도록 소프트웨어를 대규모로 확장할 준비를 갖추어야 한다는 의미입니다. 앞으로 직면하게 될 복잡성과 규모는 전례가 없기 때문에, 기존의 옵저버빌리티로는 충분하지 않습니다. 옵저버빌리티를 모든 사람이 사용할 수 있게 만들 필요가 있습니다.
설문 조사 결과에 따르면 AI 모니터링 기능의 도입률은 2024년 42%에서 2025년 54%로 증가했습니다. 이러한 두 자릿수 성장 덕분에 처음으로 AI 모니터링을 사용하는 조직이 과반수를 넘어섰습니다. 조직들은 이제 단순히 AI를 실험해 보는 단계를 벗어나 실제 고객 대면 환경에 AI를 구현하고 있습니다. 이러한 변화로 인해 조직들은 숨겨진 장애를 방지하기 위해 복잡한 분산 시스템의 작동 및 상호 작용 방식에 대한 실시간 인사이트가 필요하게 되었고, 이 때문에 보다 심층적인 옵저버빌리티에 대한 수요도 증가했습니다.
AI 기반 옵저버빌리티 플랫폼이 필수 요소로 자리를 잡았습니다. 확률적 AI 모델은 역동적이고 분산된 환경에 기반하고 기존의 불투명한 모니터링 방식으로는 실패할 수 있기 때문입니다. 대규모로 AI를 도입하는 조직에는 코드 추적이나 인프라 모니터링을 넘어, 시스템에 대한 보다 심층적인 인사이트가 필요합니다. 어떤 경우에는 AI를 모니터링하기 위해 AI를 구현하는 경우도 있습니다. 이 보고서에 따르면 경영진 중 45%가 AI 기술의 도입을 옵저버빌리티에 대한 수요의 주요 동인으로 꼽았습니다.
또한 리더들은 인시던트 대응을 개선하는 데 가장 큰 영향을 주는 AI 역량을 파악했습니다. 상위 3개 역량은 다음과 같습니다.
- AI로 지원되는 문제 해결(38%)
- 자동 근본 원인 분석(RCA)(33%)
- 예측 분석(32%)
이러한 역량들은 팀이 사용자에게 영향을 미치기 전에 문제를 진단하고 예방하는 데 도움이 됩니다. AI는 문제를 조기에 감지하고 응답을 자동화함으로써 다운타임을 줄이고 복구 속도를 높여줄 수 있습니다. 이를 통해 팀은 운영 중단에 대한 사후 대응에서 문제에 대한 선제적 해결로 전환할 수 있습니다.
옵저버빌리티의 실질적 비즈니스 가치
이 보고서는 옵저버빌리티가 비즈니스에 실질적인 영향을 미친다는 것을 명확히 보여줍니다. 영향이 큰 중단으로 인해 평균 시간당 2백만 달러 또는 분당 약 33,333 달러의 비용이 야기됩니다. 풀-스택 옵저버빌리티를 확보한 조직의 경우 평균 비용은 시간당 100만 달러로 큰 폭 줄어듭니다.
옵저버빌리티는 시스템 안정성과 가용성을 직접적으로 향상해줍니다. 설문 조사에 따르면 75%의 기업이 옵저버빌리티 투자에서 긍정적인 결과를 얻은 것으로 나타났습니다. 거의 5명 중 1명(18%)의 응답자가 3-10배의 투자 수익을 실현했다고 답했습니다. 옵저버빌리티가 기업에 제공하는 주요 이점은 다음과 같습니다.
- 계획하지 않은 다운타임 감소(55%)
- 전반적인 운영 효율성 향상(50%)
- 보안 위험 감소(46%)
엔지니어링 효율성
또한 옵저버빌리티는 엔지니어가 사후 대응 작업에 소비하는 시간을 줄여 엔지니어링 생산성과 만족도를 높여줍니다. 엔지니어는 "급한 불을 끄기 위한" 작업이나 장애 해결에 업무 시간의 33%를 소비합니다. 유지 관리와 기술 부채에 소비된 33%를 추가하면, 엔지니어는 업무 시간 중 2/3를 새로운 기능 개발 또는 코딩 혁신 이외의 작업에 소비하고 있는 셈입니다.
옵저버빌리티가 실무자(SRE, IT, DevOps)에게 제공하는 주요 이점은 다음과 같습니다.
- 알림 피로 감소(59%)
- 신속한 문제 해결 및 근본 원인 분석(58%)
- 팀 간 협업 개선(52%)
특히 AI 지원을 통해 간소화된 옵저버빌리티 워크플로우는 엔지니어가 문제를 신속하게 찾아낼 수 있도록 하여 인지 부하와 좌절감을 줄여줍니다. 이를 통해 팀은 새로운 기능을 구축하고 혁신하는 데 집중할 수 있으며, 이는 직무 만족도를 높이고 이직률을 낮추는 데 기여합니다.
당면 과제 및 솔루션: 풀-스택 옵저버빌리티 및 툴 통합
이러한 이점에도 불구하고 많은 조직이 진정한 풀-스택 옵저버빌리티를 확보하는 데 어려움을 겪고 있습니다. 설문 조사에 참여한 조직의 73%는 풀-스택 옵저버빌리티가 부족하여 기술 스택의 상당 부분에 대해 포괄적인 모니터링이 이루어지지 않는 것으로 나타났습니다. 이러한 간극은 기업을 운영 및 재정적 위험에 모두 노출시킵니다. 풀-스택 옵저버빌리티는 인프라, 애플리케이션 및 서비스, 보안 모니터링, 디지털 경험 모니터링, 로그 관리의 5가지 주요 카테고리에 대한 가시성을 확보하는 것으로 정의됩니다.
풀-스택 옵저버빌리티 달성을 가로막는 주요 도전과제는 다음과 같습니다.
- 복잡한 기술 스택(36%)
- 너무 많은 모니터링 툴 또는 분산된 데이터(29%)
새로운 서비스와 프레임워크로 더 많은 텔레메트리가 도입되면서 연결되지 않은 툴들이 늘어나기 때문에, 이러한 문제는 서로 밀접하게 연관이 되는 경우가 많습니다. 시스템 상태에 대한 뷰가 단편적이기 때문에 엔지니어는 여러 대시보드 간을 오가며 인시던트 내역을 취합하지만 정작 중요한 데이터는 보통 숨겨져 있습니다. 일관되지 않은 텔레메트리는 또한 AI에 기반한 기능의 효과를 제한합니다.
다행인 점은 조직들이 이 문제를 해결하기 위해 적극적으로 나서고 있다는 것입니다. 조직당 평균 옵저버빌리티 툴 수는 지난 2년 동안 6개에서 4.4개로 27% 감소했습니다. 이러한 추세는 너무 많은 툴이 단편적인 데이터, 높은 오버헤드, 느린 인시던트 대응 등 여러 가지 문제를 야기한다는 인식을 반영합니다.
과반수의 조직(52%)은 향후 12-24개월 내에 옵저버빌리티 툴들을 단일 플랫폼에 통합할 계획입니다. 이는 포인트 솔루션에서 벗어나 한 곳에서 시스템 상태에 대한 포괄적인 관점을 제공하는 통합 플랫폼으로 이동하고 있는 강력한 업계 추세를 강조해 보여줍니다.
2025년과 그 이후의 전략적 과제 🚀
설문 조사 결과를 보면, IT 및 데이터 리더들은 다음과 같은 세 가지 명확한 전략적 과제에 직면하고 있습니다.
- 시스템 상태에 대한 단일 뷰를 제공하는 통합 플랫폼의 우선적으로 구현해야 합니다. 이를 통해 무분별한 툴 확산을 해결하고 포괄적인 인사이트를 얻을 수 있습니다.
- 옵저버빌리티 중심의 문화를 조성해야 합니다. 이는 신뢰성을 공동의 책임으로 만들어 줍니다.
- 선제적 운영을 위해 AI를 도입해야 합니다. 이는 팀이 사후 대응 태세에서 예측 태세로 전환해 문제가 발생하기 전에 예방할 수 있도록 합니다.
옵저버빌리티의 미래에서 중요한 것은 예측적 행동, AI 및 복원력입니다. AI 애플리케이션이 비즈니스의 중심이 되고 있기 때문에 옵저버빌리티에 대한 통합된 접근 방식은 다가올 새로운 시대에 타협할 수 없는 사안입니다.
이 블로그에 표현된 견해는 저자의 견해이며 반드시 New Relic의 견해를 반영하는 것은 아닙니다. 저자가 제공하는 모든 솔루션은 환경에 따라 다르며 New Relic에서 제공하는 상용 솔루션이나 지원의 일부가 아닙니다. 이 블로그 게시물과 관련된 질문 및 지원이 필요한 경우 Explorers Hub(discuss.newrelic.com)에서만 참여하십시오. 이 블로그에는 타사 사이트의 콘텐츠에 대한 링크가 포함될 수 있습니다. 이러한 링크를 제공함으로써 New Relic은 해당 사이트에서 사용할 수 있는 정보, 보기 또는 제품을 채택, 보증, 승인 또는 보증하지 않습니다.