株式会社カプコン

業界

Media, Entertainment & Gaming

地域

アジア太平洋

Business Challenge

アップタイム、信頼性

利用用途

ゲームタイトルが共用する「カプコン共通基盤」の24時間365日の安定稼働を支えるため、開発から本番運用までの各フェーズにおいて、システムのオブザーバビリティを実現

New Relicの導入目的と成果

共通基盤のアプリケーションを含むシステム全体の監視と状態の可視化
異常の発生やサービスレベルの低下、潜在的な問題・ボトルネックなどの早期検知や原因の特定、速やかな対応の実現
検知された異常への対応の迅速化
オブザーバビリティ製品による監視、可視化が難しいとされていた分散データベースの監視、可視化の実現
新技術採用時の性能評価での活用、リスクを低減した円滑なリプレースの実現
カプコン共通基盤に連携するシステムのパフォーマンスの可視化により、問題原因の切り分けの迅速化

利用製品

New Relic APM
New Relic Infrastructure
New Relic Logs
New Relic Dashboard
New Relic Alerts

止められない共通基盤の安定稼働に向けて

株式会社カプコンは、1983年の創業以来、ゲームエンターテインメント分野において数多くのヒット商品を創出するリーディングカンパニーだ。代表作として、「バイオハザード」、「モンスターハンター」、「ストリートファイター」、「ロックマン」、「デビルメイクライ」などのシリーズタイトルを保有している。オリジナルタイトルを家庭用ゲーム機（以下、ゲーム専用機）や映画、舞台、アニメ、キャラクターグッズなど、さまざまなメディアやジャンルに多面的に展開する「ワンコンテンツ・マルチユース」戦略を推進し、成長・発展を続けている。

そうした同社では、各ゲームタイトルが共通して使う機能を1つにまとめたバックエンドシステム「カプコン共通基盤」（以下、共通基盤）を開発し、運用している。

同基盤について、その開発・運用を担っている株式会社カプコン CS制作統括 CSシステム開発部のインフラエンジニア、福井勝貴氏は次のように説明する。

「共通基盤は、複数のプラットフォーム上に展開されているゲームタイトルなどに対して、クロスプラットフォーム対応の共通機能やデータを管理・提供するシステムです。『アカウント管理』と『（ゲーム利用者の）プロフィール管理』『同意規約管理』『ゲーム内通貨・DLC管理』『ID会員情報管理』などの機能を提供する5つのシステムで構成されています」

株式会社カプコン CS制作統括 CSシステム開発部福井勝貴氏

共通基盤は、複数のゲームタイトルで継続的に利用されるシステムであり、利用者情報の管理機能を備えている。そのため、セキュリティはもとより、24時間365日の安定稼働が求められ、それを実現するための監視体制が整えられている。その監視を支えるプラットフォームとして使われているのがNew Relicだ。

共通基盤の包括的な可視化を目指しオブザーバビリティを導入

同社では共通基盤の開発プロジェクトを始動させた2020年4月にNew Relicの検証をスタートさせ、同年7月に正式に導入した。

New Relicは業界を代表するオブザーバビリティプラットフォームであり、国内では46％のトップシェアを獲得している。デジタルサービスにおけるあらゆる重要指標の「観測」を可能にし、アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する。

オブザーバビリティを共通基盤に導入した目的について、福井氏は「共通基盤を安定して動作させるうえでは、インフラの状態をとらえるだけではなく、APMを活用し、アプリケーションやミドルウェア、データベースなどの状態も併せて可視化し、異常を速やかに検知できるようにする必要があります。それを実現できる有効な手立てが、システム全体の状況を包括的に可視化できるオブザーバビリティだと考えました」と述べる。

加えて同社には、共通基盤の開発から本番運用に至る各段階でシステムのオブザーバビリティを実現し、異常を速やかに検知して改善を図るという狙いもあった。この狙いについて、福井氏は次のような説明を加える。

「共通基盤は、共通基盤のエンジニアが利用する『開発・負荷試験』用の環境と、ゲームタイトル側に提供する『開発から本番運用』のための環境に分かれています。共通基盤のエンジニア向け環境では、オブザーバビリティを負荷試験環境のみに導入しており、性能評価や課題の洗い出しに活用しています。一方、ゲームタイトル向けのシステムは、幅広く利用されているため、課題によっては影響範囲が広がる可能性があります。そのため、開発から本番運用までの各フェーズでオブザーバビリティを活用し、迅速な異常検知と対応を目指しました」

こうしたオブザーバビリティを実現する製品はNew Relic以外にもある。その中でNew Relicを選んだ要因は何だったのか。福井氏は「New Relicはユーザー数に基づく明確な料金体系のため、コストの見積もりが容易でした。また、メトリクスやトレース、ログ、イベントといった多様なデータを収集、可視化する機能が単一のプラットフォームにすべて統合されており、さまざまな機能を導入しやすいことに加えて、New Relic日本法人による手厚いサポート体制も高く評価しました」と答える。

システム全体の監視をNew Relicで実現分散DBの性能評価と実運用も円滑に

同社では現在、New RelicのAPMやログ、アラート機能などを使い、開発から本番運用までの各フェーズでシステムの異常を早期にとらえ、その原因を速やかに特定して対策できるようにしている。また、アラートについては、社内で使用しているチャットツールに通知を飛ばし、関係者が異常にすぐに気づける仕組み、体制も整えている。

さらに、APMとログを問題原因の特定や解決の迅速化に生かしているほか、ダッシュボードを使ったシステム全体の可視化と情報の共通化も図っている。

同社によるNew Relic活用で注目すべき点の１つは、共通基盤で使用されているデータベースの1つ「TiDB」の監視も、New Relicで一括して行えていることだ。TiDBは、PingCAP社が提供している分散型のNewSQLデータベースで、「MySQL」との互換性を有するほか、性能増減やアップグレードなどのメンテナンス作業についてシステムを止めることなくオンラインで行えるといった特長を備えている。

同社では2024年9月に共通基盤における認証アカウント管理とプロフィール管理のデータベースをTiDBに切り替え、同データベースのライト版「TiDB Cloud Starter」を開発・QAなどの小規模なワークロードの環境で使用し、エンタープライズ版の「TiDB Cloud Dedicated」を負荷試験やステージング、本番環境で使用している。

このうち、TiDB Cloud Dedicatedについては、New Relicとの連携機能が備わっており、New Relicのダッシュボード上でリソースの使用状況やデータベースクエリの情報が簡単に可視化でき、負荷試験などの性能評価をスムーズかつ容易に行えたという。ただし、TiDB Cloud Starterはフルマネージドで自動スケーラビリティ、プロビジョニング、管理、メンテナンスが不要のため、利用者側は特にこの部分を意識することなく利用することをコンセプトに作られており、TiDB Cloud上にもメトリクスや監視機能は最小限のものしか実装されていない。そのコンセプトのためNew Relicとの連携機能は実装されておらず、New Relicのダッシュボード上で状態の可視化や監視をすることが難しかった。同社では、New Relicの利用を工夫することによりTiDB Cloud Starterについても、New Relicで状態を監視し、ダッシュボード上で可視化できるようにしている。

その工夫に関して福井氏は「我々が着想したのは、New RelicのAPM内に蓄積されていくデータベースクエリに関するデータ（メトリクス）を使ってTiDB Cloud Starterの状態を可視化するというアイデアです。これにより、TiDB Cloud StarterのNew Relicによる監視、可視化が可能となりました。この変更によりTiDB Cloud DedicatedとTiDB Cloud Starterのデータベースクエリに関するメトリクスの監視・可視化の統一が可能となりました。 TiDBに関しても、開発から本番運用に至る各段階でのオブザーバビリティが実現され、速やかな異常の検知や問題原因の特定が行えるようになったということです」

また、こうした新たな技術・製品を導入した際の性能評価にもNew Relicは貢献しているという。「APMを活用したTiDBの監視設定は、従来のデータベースでも利用できるため、TiDBにリプレースする前から事前に設定し、切り替えることができました。そのため、当日のリプレース作業負荷や作業量を減らしながらスムーズにデータベースを移行することができました。New Relicがあることで、共通基盤に求められる新たな要素も安全に評価・導入できるという、ケイパビリティの広がりを実感した機会でした（福井氏）」

対応・改善の迅速化と効率化を実現し運用工数も削減

New Relicの活用は、数々の効果へとつながっている。効果の1つは、共通基盤における異常の速やかな検知と対応が実現されていることだ。

福井氏は「New Relicの活用により、アラートを通じて関係者が異常の発生を即座にとらえ、ダッシュボード上で何が起きているかを即座に確認し、問題原因を特定できるようになっています。New Relicを利用していなかったら、検知した異常への対応時間は平均1時間程度増加していた」と指摘する。

福井氏によれば、異常に対応するスピードの向上には、APMの「External Services」機能も大きく寄与しているという。同氏は「External Servicesの働きによって、共通基盤と連携する外部サービスのパフォーマンスも可視化され、問題原因の切り分けと対応がスピーディーに行えています。この効果はとても大きいと感じています」と説明する。

また、共通基盤における監視と基本運用の仕組みをNew Relicで統一できたことで、運用の効率性とコストパフォーマンスも向上している。この点について福井氏は「例えば、New Relicの導入を機に、ログの収集と分析の仕組みを『Kibana』と『Elasticsearch』の組み合わせから、New Relic Logsへとリプレースし、ダッシュボードも統一化しました。それによって運用に要する工数とコストが削減されています」としている。

ダッシュボードを通じた情報の共有化によって、関係者の共通基盤の状況の把握と相互の意思疎通がスムーズになり、結果として運用効率が高いレベルで維持されている。

さらにNew Relicの活用として、「監視設定のTerraform化」を導入しており、設定ミスの回避や各環境への展開の効率化が実現されているという。

この効果に関連して福井氏は「New Relicによる可視化においては、異常の早期発見や問題への迅速な対応、あるいは、システム改善のスピードアップといった実質的な成果へとつなげるために、どのデータを監視・可視化するかの設定を適切に行うことが大切です。APMの導入によって、ある一定の恩恵・効果を得ることができます。さらなる効果を得るには、アプリケーションのエラーやログの有効活用が不可欠です。ただ、アプリケーションエラーやログの可視化・監視は意識して行う必要があり、そう簡単ではありません。開発エンジニアが定義したアプリケーションエラーやログがどういう意味を持つものか、異常に気づくためにどういったものが必要なのかを意識した上で設計を行っていないと、New Relicによってそれらの監視・可視化が簡単に行えるようになったとしても、期待した効果にはなかなかつながらないと思います」と指摘する。

共通基盤の拡充と監視・運用のさらなる最適化へ

共通基盤はすでに数十のゲームタイトルに使われているが、福井氏は「共通基盤を使うゲームタイトルについてさらなる拡充を推し進めたいと考えています。併せて、監視の方式を、New Relicに統合できる『AWS CloudWatch MetricStream』へと移行させ、メトリクスの拡充、AWSの新機能・サービスへの対応や監視体制の強化、ゲームタイトルごとの共通基盤の利用状況の可視化と運用の自動化などを図っていく考えです」との展望を示す。

加えて今後は、New RelicのAI機能の導入も積極的に検討していく構えだ。

福井氏は「AI機能については、アラートやログの分析を通じて対応の必要ない事象を自動的に除外して監視・運用の業務負荷の軽減につなげるといった使い方を想定しています。AIはシステムにおける脆弱性の分析や対策の提案などにも有効なようなので、そうした使い方もしてみたいと思っています。」と明かす。

さらに同氏は、New Relicを共通基盤におけるクラウドコストの可視化にも活用したいと考えており、2025年6月にNew Relicが発表したクラウドコスト管理ソリューション「Cloud Cost Intelligence」の導入も検討している。その点を踏まえながら、福井氏は次のようにNew Relic活用の展望をまとめる。

「New Relicの活用によって、共通基盤というバックエンドシステムの安定性を高めるという目的は相応のレベルまで果たせたと見ています。今後は、クラウドコストをNew Relicで一元的に可視化し、効率化・最適化を図っていきたいと考えています。New Relicには、そうした我々の取り組みを支える優れた技術の提供をこれからも期待しています」

Recommended