利用用途
AWS、Azure、GCP、IBM Cloudなどのパブリッククラウド上に構築した顧客システムに対して、統合的な運用監視を行う「クラウドマネージドサービス」にNew Relic Oneを活用
New Relicの選定理由と成果
- マルチクラウド環境におけるフルスタックオブザーバビリティの実現
- エンドユーザー視点でサービス品質を可視化し問題発生時の解決を迅速化
- アプリ、インフラ、運用チームの相互理解が深まりDevOpsの推進が可能に
ベル・データが、パブリッククラウド上に構築した顧客システムの運用監視を担う「クラウドマネージドサービス」の提供を開始した。本サービスは、アウトソーシング、クラウド、アプリケーション、ハード/ソフトウェア、インフラ、サポートまでを網羅する同社の「One Stop Service」を、クラウドネイティブの領域へ大きく前進させるものだ。DX推進部 クラウド推進課 課長であり、テックリードを務める篠﨑素法氏は次のように話す。
「DX推進部は、クラウドテクノロジーを活用してお客様のデジタル変革を支援するチームです。オンプレミス環境のクラウド移行から、IaaS/PaaSを効果的に活用したインフラ設計・構築、マイクロサービスアーキテクチャーを採用したコンテナアプリケーションの開発まで、お客様のクラウド活用を幅広くサポートしています。『クラウドマネージドサービス』は、クラウドの監視もベル・データに任せたい、というお客様の声に応える形でサービス提供を開始しました」
ベル・データは、IBMパートナーとして長年の実績があり、中堅・中小の製造業、物流企業などに強固な顧客基盤を持つ。IBM Power Systems/IBM iの提供実績は4,000件に迫る。
「新たに提供を開始した『クラウドマネージドサービス』では、お客様単位で個別に対応してきたシステム/アプリケーションのモニタリングサービスを統合するとともに、エンドユーザーのサービス体験(CX)の視点からシステム運用の品質向上を目指しました」(篠﨑氏)
顧客システムはAWS、Azure、GCP、IBM Cloudなど様々なクラウド上に構築されている。マルチクラウドに対応する統合的なモニタリングツールとしてベル・データが選択したのは、オブザーバビリティ(可観測性)プラットフォームNew Relic Oneである。
マルチクラウド環境のオブザーバビリティを実現
New Relic Oneは業界を代表するオブザーバビリティ(可観測性)プラットフォームであり、デジタルサービスにおけるあらゆる重要指標の「観測」を可能にする。アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する機能は業界随一との評価を得ている。
「モニタリングツールの選定には、大きく3つの方針を掲げて臨みました。①マルチクラウド環境のアプリケーションとインフラの監視が可能なことを前提に、②エンドユーザーの体験を定量化・可視化すること ③モニタリングツールの集約によりエンジニアの学習効率を高めることです。New Relic Oneはすべての要件を満たしているだけでなく、十分に使いこなすことで『クラウドマネージドサービスのお客様価値を高めることができる』と直感しました」と篠﨑氏は話す。
篠崎氏が最初に注目したのは、New Relic Oneのアプリケーションパフォーマンス管理(APM)だった。
「ユーザー体験を計測することを起点に、新しいクラウドマネージドサービスを設計しています。New Relic OneのAPMは、フロントとバックエンド間の通信をひとつのプロセスとして見通して、ユーザー体験をダッシュボード上に可視化できることを評価しました。GUIの使いやすさはもちろん重要ですが、エンジニアが見たい情報を見たい形で可視化できることはさらに重要です。New Relic Query Language(NRQL)により、機能やダッシュボードを柔軟にカスタマイズできることは大きな評価ポイントです」(篠﨑氏)
New Relic One のAPMは、Webアプリケーションのレスポンスタイム、スループット、エラー率、トランザクションなどを可視化するとともに、ユーザー体験に影響するコードやコード間の依存関係をリアルタイムで特定する。ユーザー体験に影響しそうな問題の予兆を検知することも可能だ。
「たとえばECサイトでレスポンスが悪化する予兆があらわれると、Syntheticsによる外形監視がこれを検知して自動通報します。エンジニアは、APMとInfrastructureによって、アプリケーションプロセスのどこにボトルネックがあるのか、その原因がコードあるいはインフラのどこにあるのか即座に特定できます。アプリとインフラどちらの問題か、切り分けに苦労することもありません」(篠﨑氏)
フルスタックエンジニアによるマネージドサービスを提供
「クラウドマネージドサービス」の業務に携わるのは、ベル・データが誇るフルスタックのエンジニアである。DX推進部では、アプリケーションからインフラまで広範な技術スタックに精通した人材を育成し、問題解決の迅速化とサービス品質の向上に取り組んでいる。New Relic Oneの導入効果はすぐにあらわれた。
「問題の検知から、原因の特定までのリードタイムが劇的に短縮されました。New Relic Oneを使えば、インフラエンジニアがスロークエリやコード上の問題点を特定することも難しくありません。誰もが正しく原因を特定できるようになり、ムダなエスカレーションはなくなり、問題解決の初動が圧倒的に迅速化されたことが、サービス品質の向上にダイレクトに結びついています」(篠﨑氏)
また、従来はクラウドサービスごとにCloud WatchやAzure Monitorなど様々なツールを使い分ける必要があったが、New Relic Oneに一本化されたことでエンジニアの学習効率・業務効率も確実に上がっているという。
「New Relic Oneを高度に使いこなすことはもちろん重要ですが、もうひとつ見逃せないメリットがあります。ユーザー体験を起点にシステム全体を俯瞰的に見て、ドリルダウンしながらアプリケーションやインフラリソースを詳細に見ていく経験を重ねる中で、エンジニアが様々なテクノロジー領域に対して理解を深められることです。SREに求められるスキルを着実に高めていくことができます」と篠﨑氏は話す。
New Relic Oneのメトリクスの共有が進む過程で、アプリケーション開発、インフラ設計・構築、マネージドサービスにそれぞれ携わるチームの意識やコミュニケーションが変わっていったという。
「チーム間の相互理解が深まるとともに、お客様視点・全体視点でサービスやシステムを見通す習慣が根づいてきたと感じています。担当領域ごとの縦割り意識が解消し、クラウドサービスの提供を通じて全員でお客様のDXを支援するというベクトルに向かっています。図らずもDevOpsが実践される形になったことは、期待以上の効果と言えるでしょう」(篠﨑氏)
クラウドマネージドサービスの顧客価値を高める
New Relic Oneならクラウドマネージドサービスの顧客価値を高めることができる、という篠﨑氏の直感は見事に的中した。新たに進めているチャレンジのひとつはSLI/SLOの定義である。
「システムの稼働率やレスポンスタイムをNew Relic OneのSyntheticsで定常的に計測し、サービス品質の指標・目標として定義したうえで、運用監視の継続的な改善を行っていきます。将来的には、ベル・データがクラウドから提供している各種サービスのSLAとして提示する考えです」と篠崎氏は話す。
もうひとつのチャレンジは、ベル・データのクラウドマネージドサービスを特徴づけるものになるかもしれない。ビジネスKPIのNew Relic Oneダッシュボードへの統合である。
「たとえば、ECサイトを運営するお客様がキャンペーンを実施した際に、アクセス数とレイテンシを参照すればスパイク対応を改善することも容易です。さらに進めて、バスケット分析とサービス品質を結びつけて考察し、より良い顧客体験と収益の最大化を追求することもできるでしょう」(篠崎氏)
ビジネスKPIの統合は、モニタリングツールの枠を超えた「オブザーバビリティ(可観測性)プラットフォーム」としてのNew Relic Oneの価値と言えるかもしれない。篠崎氏は次のように結んだ。
「ベル・データのクラウド上でより良いユーザー体験を提供し、お客様のビジネス成果に具体的に貢献し、お客様とともに次の目標を目指すことができればこれに勝る喜びはありません。私たちがオブザーバビリティを推進していく上で、New Relicによる技術サポートや適切なアドバイスには本当に助けられました。私たちのクラウドマネージドサービスを、よりお客様価値の高いサービスとして成長させていくために、今後も一層のご支援をいただき、良きパートナーとして歩んでもらえることを期待しています」