通販やECサイト向けに決済サービスを提供するGMOペイメントゲートウェイ株式会社。毎年増え続ける取引量へ対応するため、2019年6月「PGマルチペイメントサービス」をアプリケーションレベルから刷新した。決済手段ごとにマイクロサービス化したことで、アプリケーション性能のプロアクティブな監視が必要となり、New Relicの導入を決断。性能に関して問題解決時間の50%削減、インシデント・ゼロを目指して運用を開始している。
利用用途
通販、ECサイト向けの総合決済システム「PGマルチペイメントサービス」におけるアプリケーション性能監視
New Relicの選定理由と成果
- 性能ボトルネックをサービス全体にわたって可視化
- テスト工数の大幅削減
- 障害対応工数50%削減
- 平均検出時間(MTTD:Mean Time To Detect)の最小化
- サービス可用性30倍
増え続ける取引量を見越してマイクロサービスアーキテクチャへと刷新
GMOペイメントゲートウェイ株式会社はGMOインターネットグループで、通販、ECサイト向けの総合決済システム「PGマルチペイメントサービス」を提供する企業である。PGマルチペイメントサービスは、クレジットカード決済やコンビニ決済から、スマホ決済まで25種類以上の決済手段を有している。通販やECサイトにとっては、様々な決済手段を一括導入できるため、売上アップにつながりやすい。契約も一本化されることで、決済の締め日や入金日が統一でき、入出金管理の手間も削減。さらに複数の決済手段や機能を1つの管理画面で管理し、効率的なサイト運用が可能になるほか、カード情報はGMOペイメントゲートウェイが管理するため、情報漏えいなどのリスクも回避できる。
こうしたメリットが評価されて、通販、ECサイトでの採用が拡大している。
「サービスを提供する上では、セキュリティ、決済手段の増加に対応できるスピードやサービス品質を重視しています。特に消費者のネットショッピング増加に伴い、決済処理をする取引量は増え続けており、それに対応していくことが大きな課題になっていました」
と、GMOペイメントゲートウェイ システム本部 決済サービス統括部 統括部長 鈴木隆志氏は明かす。
決済サービス統括部 統括部長
鈴木隆志氏
そうした中、同社は5年先の取引量に耐えられることを目標に掲げ、2019年6月にはアーキテクチャを刷新し、取引量の増加に対応できるようアプリケーションレベルから構築し直した。最大のポイントはマイクロサービス化。従来は1つのアプリケーションですべての決済を行っていたが、決済手段ごとにアプリケーションを分けた。これにより、可用性と拡張性は大きく向上したが、同時にそれぞれのアプリケーションの性能監視も不可欠な状況になったのである。
分散トレーシングのためにAPM導入を検討
今までのシステムは単一のアプリケーションだったため、動作を定期的に監視する仕組みを採用。その結果、100ミリ秒のレベルだが、APIのレスポンス遅延をリアルタイムで把握できていない点に課題を感じていたという。
「ユーザーは気づかない程度ですが、遅延が長期間にわたって放置されると、リソースが枯渇して全体に波及し、システム停止につながりかねません」
と、GMOペイメントゲートウェイ システム本部 ITサービス統括部 サービスインフラ部 サービス運用グループ 課長 佐久間洋明氏は説明する。
同社では、アプリケーション数が5倍に増えたシステムの監視を行うために、アプリケーション性能管理(APM:Application Performance Management)の導入を検討することにした。
ITサービス統括部 サービスインフラ部 サービス運用グループ 課長
佐久間洋明氏
「分散トレーシングという言葉は以前から聞いていたのですが、そのためにAPMというジャンルの製品があることがわかりました。そこで、イベントに出展していたNew Relicのブースに行って話を聞き、トライアル導入してみることにしたのです」(佐久間氏)
GMOペイメントゲートウェイではNew Relicともう1製品、クラウドで提供されているAPMをトライアル導入し、試してみた。
New Relicの導入によって様々な性能監視が可能に
実際にトライアル導入した結果、GMOペイメントゲートウェイはNew Relicの「New Relic APM」導入を決定。New Relic APMを選んだ理由は、「トランザクションの詳細情報を参照して、迅速に根本原因を発見、問題解決できたこと」「トライアル段階でも、サポート窓口に色々と質問でき、分からないことも営業担当が親身になって丁寧に教えてくれたこと」の2つだった。
PGマルチペイメントサービスのトランザクションは、データベースアクセスと決済事業会社のオーソリゼーションから構成される。オーソリゼーションが遅延するのは決済事業会社の問題だが、データベースアクセスが遅れるのはGMOペイメントゲートウェイ側のシステム問題。運用する上では、具体的な不具合を掘り下げて、エラーの発生原因を突き止めることが欠かせない。New Relic APMは分散トレーシングで、複雑なシステムでのエンドツーエンドから単一のリクエストのパスの追跡を行う。どんなサービスや依存関係でもデータベースにさかのぼって、チェーン全体の追跡が可能で、パスのどの段階でボトルネックやエラーが発生しているかが分かるので、遅延の予兆を掴み、リアルタイムに問題を解決できる。
GMOペイメントゲートウェイでは、「New Relic APM」「New Relic Infrastructure」「New Relic Synthetics」の3製品を利用することにし、試験運用を行った上で、2019年12月に本番環境への導入を完了させた。これによって、サーバーとそれが依存するアプリケーションやサービスの稼働状態がすべてリアルタイムで一元的に監視できるようになっている。そして、アプリケーションの統合的な監視とAPI単位での性能の自動検出、アプリケーションコード内の問題箇所の詳細な画面表示、メモリ、データベースコネクション、バッチ、管理画面の性能監視が可能になったという。
一元的な可視化が高い稼働率や可用性につながる
導入後、開発環境で遅延が発生。従来であれば、原因究明から解決まで時間がかかっていたが、すぐにボトルネックを発見できた。
「導入してから2カ月ほどしか経っていなものの、開発環境ではすでに成果が出ていますし、様々な領域での可能性が見えてきています。本番環境リリース前、テスト環境での性能チェックもNew Relicを使うことで、テストの工数圧縮が可能になりますし、これまでブラックボックスになっていた部分も解明できるでしょう」
と鈴木氏は明るく話す。
同社では、2020年初めからNew Relicでクレジットカード決済を軸に主要なAPIのしきい値に関するチューニングを実施する。システム全体に影響が出そうなものや傾向的に悪くなっていくものについて、アラートを出せるようにしていく。
「今でもアプリケーションの監視はしっかり行っていますが、今後はオーソリゼーションの失敗やECサイト側からのリクエストの間違いなどのような特定の顧客ごとのエラー率、時間帯による変化を、New Relicならではのダッシュボードで、一元的に可視化していきます」(鈴木氏)
こうした取り組みを通して、システムのダウンタイムがなく稼働する超高稼働率、メモリ関連など性能に関する問題解決時間の50%以上の短縮、性能に関するインシデント・ゼロを目指す。また、加盟店向けのテクニカルサポートや営業向けに「PGマルチペイメントサービス」のサービス稼働状況を知らせるダッシュボードの提供も計画。さらに、同社以外のGMOインターネットグループのサービスでも、New Relicの利用を視野に入れて取り組みを進めていく考えだ。