NECネッツエスアイ株式会社 松田 創 氏の写真

旧来型の運用監視を革新!
インフラ技術とオブザーバビリティを軸としたアーキテクトへ

松田 創(まつだ・そう)氏
NECネッツエスアイ株式会社
インフラエンジニア

大学ではネットワークを専攻。その知識を活かすことを考えて2015年に大学を卒業後、NECネッツエスアイ入社。当初はインフラエンジニアとしてコンテナ関連の技術検証やクラウドサービス基盤の設計・構築・運用に取り組む。2021年よりお客様のDXを推進する「Symphonict」ブランドのサービス開発に従事。人物の違和感や人流を解析・検知する映像AIサービスなどを設計・構築した。2023年からSymphonictサービスの開発で使用する共通プラットフォームの設計、構築、導入支援を担当。オブザーバビリティの導入も手掛けている。趣味は、大学時代から続けているカメラ。休日などに出先で気に入った風景を写真に収めている。

■2020年頃、SREに興味を持ったことがきっかけに
― いつごろ、どのようなきっかけでオブザーバビリティと出会われたのでしょうか。

インフラエンジニアとして、システムの信頼性を向上するための技術検証などを推進していた2020年頃、SREという考え方に出会いました。Webサイトやサービスの信頼性を高めるために、SREではどのようなアプローチを行うのかということに興味が湧き、SREに関する情報を収集したり、勉強会に参加したりして、知識の習得を行っていました。こうした取り組みを行っていくなか、とあるエンジニアの方のブログ記事で「オブザーバビリティ」という概念があることを知りました。

最初に抱いた印象は、運用監視を行うモダンな考え方のひとつなのかな、というざっくりしたもので、業務に直接活かす機会もありませんでしたが、ユーザー体験を重視する考え方に興味を持ち、情報収集は定期的に行っていました。

本格的にオブザーバビリティの導入を検討し始めたのは、現在所属している部門へ異動した2023年からです。当社では、お客様のDX実現に向けて「Symphonict」というブランドで各種のサービスを提供しており、その社内向け共通開発プラットフォームを設計するチームが2023年に組織され、所属メンバーとして私もアサインされました。このチームで取り組むべき内容について議論したとき、重要なテーマのひとつにあがったのが、オブザーバビリティでした。

NECネッツエスアイ株式会社 松田 創 氏の写真

■全社視点でサービスレベルを定義し、簡単に可視化できるツールを選定
― オブザーバビリティ導入に向けては、どのように取り組まれたのでしょうか。

最初に取り組もうとしたのは、既存のSymphonictサービスのサービスレベル管理の改善です。当時は、とあるクラウドサービスの機能を組み合わせてサービスレベル管理の仕組みを自前で構築しており、一定のコストも発生していた状況でした。また、サービスを開発した各チームで、それぞれサービスレベル(SLI、SLO)を定義していましたが、チームごとにSLIの粒度に差があり、SLOベースの運用ルールが定まっていないチームもある状態で、全体的なSLIの見直しと共通の運用ルールの策定が必要だと認識していました。

並行して、Symphonictサービスを開発する各部門のメンバーに対するヒアリングも行いました。そこであがってきたのは、「ユーザに近いフロントエンド側のパフォーマンスの測定やAPMが簡単に実施でき、ダッシュボードなどで開発メンバーも運用メンバーも、さらにビジネスサイドの人たちも共通の仕組みで簡単にわかりやすく提示したい」という要望でした。

こうした要件に基づいて、適切なツールの選定に着手しました。そこで、サービスレベル管理やダッシュボードの機能が提供されており、各チームが簡潔にサービスレベル管理を行うことが可能、さらにRUM(リアルユーザーモニタリング)やAPMに強みを持ったNew Relicを採用しました。

■情報共有が課題解決につながり、サービス品質向上に貢献
― オブザーバビリティの導入に際して印象に残っていることをお聞かせください。

オブザーバビリティとNew Relicの導入に向けて、私を含むプラットフォームチームが主体となり、情報共有や勉強会を企画・実施しています。それぞれの導入に伴うメリットを説明する活動を始めとして、New Relicを活用するための勉強会などを、開発メンバーだけでなく、ビジネスサイドのメンバーに対しても行っています。

こうした活動を進めていくなかで印象に残っているのが、あるサービスの構築と運用を行っているチームのプロダクトマネージャーから相談を受けたことです。そのチームが抱えていたのは、特定のページの画面表示が遅くなる、また原因不明のJavaScriptのエラーが発生するという問題、というものでした。開発現場だけでなく、チーム全体で課題を解決しようとアプローチしてもらえたことが嬉しかったことを覚えています。課題解決に向けては、New RelicのBrowserやRUM、外形監視などを利用することで、開発チームと協力して原因究明を行うことができました。

こうした成果を社内で共有することで、オブザーバビリティの概念が着実に社内へ浸透していると感じています。

■運用監視をオブザーバビリティで革新する
― オブザーバビリティに対する今後の展望について教えていただけますか。

まずはアラートによる監視・モニタリングを主体としている既存のサービスに対して、オブザーバビリティを導入していきたいと思っています。アラート起点のサービス監視ももちろん大事ですが、サービスのテレメトリデータを常に収集し、現在のサービス状況を正確に把握することが重要だと考えています。抱えている課題や問題が発生しそうな場所を早期に見つけ出し、改善のサイクルを回してユーザ体験の良いサービス提供を続けていくような環境・文化を醸成していきたいです。

そのために、今後も社内メンバに対して定期的に情報共有やコンテンツ提供を行っていきたいと考えています。 New Relic社の協力を得ながら、様々なメンバに対して勉強会を開催していき、社内全体のオブザーバビリティへの理解を高めていきたいです。こうした取り組みを続けていき、Symphonictサービスだけでなく全社的なサービスの価値向上に貢献していければ嬉しいです。

■フルスタックエンジニアに成長することで目標のアーキテクトに
― 今後の展望を踏まえて、ご自身のキャリアはどのような姿を描かれているのでしょうか。

現時点で目標に掲げているのは、“インフラ技術とオブザーバビリティを軸としたSREエンジニア”になることです。これまでインフラエンジニアとしてキャリアを歩んできましたが、SREの考え方やオブザーバビリティに触れていく中で、特に必要性を感じているのがアプリケーション開発の知識です。

クラウド上でのサービス運用において、例えばアプリケーションをリリースするためのCI/CDパイプラインの構築や各種APIを活用した作業の自動化の必要性は年々高まってきていると感じています。また、New Relicでは、NerdGraph APIを利用した設定変更や、サービスの外形監視をSynthetics Monitoringで行う際にコードを記述してより柔軟な監視設定を導入することもできます。

こういった観点で、いち早くアプリケーション開発への理解と知識を深めていきたいと考えています。これまでインフラエンジニアとして学んできたことをベースに、オブザーバビリティの考え方とアプリケーションの知識を組み合わせて、課題解決力のあるSREエンジニアとして活躍していきたいと思っています。

NECネッツエスアイ株式会社 松田 創 氏の写真