オーケー|サーバーレスで構築されたデータ連携基盤を軸に、店舗業務と事業成長を支える全システムを観測。保守・運用・障害対応の一元化・効率化を推進

ok main

利用用途

サーバーレスで構築されたデータ連携基盤「DataHub」を軸に、事業と店舗業務を支える多種多様なシステムのクラウドシフトを推進。クラウドに展開した全システムのパフォーマンスと運用の品質を高いレベルで維持すべく包括的に観測

New Relicの導入目的と成果

  • 既存システムのクラウドシフトやクラウド上での顧客向けシステムの開発・運用を推進するにあたり、多種多様なシステムの状態やユーザー体験を包括的に観測できるソリューションが必要に
  • クラウドに展開する全てのシステムにオブザーバビリティを導入し、異常の検知、修正対応のスピードアップとプロセスの標準化を図る
  • モバイルアプリからネットスーパーシステム、基幹系・業務系システム、さらにはサーバーレスのデータ連携基盤に至るまで、あらゆるタイプのシステムに対する一元的な観測を実現。異常の検知、原因特定のスピードアップ
  • ネットスーパー決済時のページ遷移時間が半減。関連問い合わせをゼロに削減
  • IT部門が運用するほぼ全てのシステムの観測が単一のプラットフォームで可能となり、障害対応プロセスの可視化、標準化へ。今後は障害のプロアクティブ対応も

利用製品

  • New Relic APM
  • New Relic Infrastructure
  • New Relic Synthetics
  • New Relic Browser
  • New Relic Logs
  • New Relic Dashboard
  • New Relic Alerts & AI

 

オーケーの経営方針は、『高品質・Everyday Low Price』であり、「毎日が特売」の方式で、ナショナルブランド商品については競合店の売価を調査し、オーケーの価格が競合店の価格(特売品・目玉品を含む)より高い場合、『競合店に対抗して値下げしました』のPOPをつけ、値下げして販売している。この方針と「借入無しで年率 20%成長を達成する」という経営目標のもと、1都3県に多数の店舗を展開し、売上げを伸ばしてきた。2024年11月以降は、関西エリアへの出店を予定している。同社の売上高は2023年3月期で5,500億円を超え、同年9月期は中間期だけで3,000億円強を売り上げている。

「当社の店舗数は急速に拡大しており、その中で店舗の運営や事業の成長に不可欠なシステムを、高パフォーマンスかつ、安定して稼働させることがIT本部の役割です。私達は『現場の業務を止めないこと』を第一に考えています。」(オーケー IT本部 副本部長 兼 DX推進部 部長、荒川 健児氏)

arakawa-sama

IT本部 副本部長 兼 DX推進部 部長 荒川 健児氏

システム運用の効率化を目指し、クラウドシフトの方針を打ち出す

IT本部が運用を担ってきたシステムは、マスタ管理や物流管理・会計管理といった機能を持った基幹システムから、各種業務システムまで多岐にわたる。また、それぞれの開発パートナーやプロバイダーも異なっており、ゆえに運用の業務負担は大きかった。その課題を解決することを主眼に、同社では、全てのシステムの基盤をクラウドへと移行させる方針を打ち出した。

「この方針のもと、新たに開発するシステムや、更改のタイミングを迎えたシステムは全てクラウドシフトの対象にしました。その中で始動させたのが、オブザーバビリティプラットフォームのNew Relicを活用し、クラウドに展開したシステムを観測する活動です」(荒川氏)

オブザーバビリティで、ネットスーパーの顧客体験を支えるシステムを観測

New Relicは業界を代表するオブザーバビリティプラットフォームであり、国内では39%のトップシェアを獲得している。デジタルサービスにおけるあらゆる重要指標の「観測」を可能にし、アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する。

New Relicによる観測が最初に適用されたのは、ネットスーパーのサービスを支えるシステム(以下、ネットスーパーシステム)だ。

オーケーでは、2021年10月からネットスーパーのサービスを展開している。これは、同社の会員(オーケークラブ会員)限定のサービスであり、同社の店舗で扱っている商品を、インターネットを介し、店舗と同じ価格で販売して顧客のもとに配送するというものだ(*1)。

「このサービスを支えるネットスーパーシステムは、クラウドシフトの方針に則った初の仕組みです。お得意様に向けたシステムですので、高いレベルの可用性と性能を確保し、良質のユーザー体験を提供することが求められました。そこで、New Relicでオブザーバビリティを実現し、サーバーの状態だけではなく、アプリケーションの性能やユーザー体験などを包括的に把握することで、異常をリアルタイムにとらえ、対処できるようにすべきと判断しました。現在は、New Relicのダッシュボードを協力会社と共有し、システムの状態を監視しています」(オーケー IT本部 業務システム部 生鮮・総菜グループ マネージャー代行、長岡 雅之氏)

*1 ネットスーパーのサービスを利用するには別途入会金の支払いと、1度に1万円(税抜き)以上の買い物をすること、配送料の負担が必要となる。

nagaoka-sama

IT本部 業務システム部 生鮮・総菜グループ マネージャー代行 長岡 雅之氏

オブザーバビリティがデータ連携基盤の可用性と性能も担保

ネットスーパーシステムに続き、同社では2022年10月にオーケークラブ会員カードをモバイルアプリ化してリリース。そのアプリ(以下、会員アプリ)にもNew Relicによるオブザーバビリティを適用した。

また、それと並行して更改のタイミングを迎えた基幹システムや各種業務システムも段階的にクラウドへと移行中。全てをNew Relicで観測することを目指している。

「基幹システムのクラウドシフトに際して、当社ではデータ連携基盤の『DataHub』を新たに開発し、基幹システムの構造を変革しました。具体的には、基幹システムを、DataHubと会計・物流・在庫管理などをそれぞれ担ういくつかのサブシステムに分離しました。また、DataHubには基幹系のサブシステムだけではなく、クラウドに展開した全てのシステムがつながります。つまりDataHubは、多種多様なシステムが並存する複雑な仕組みをデータレイヤとサブシステムに分離し、シンプル化することで保守性を上げる役割を担っています。この基盤は、クラウド上に展開した全てのシステムと連携する仕組みなので、安定動作とパフォーマンスの維持が不可欠です。その要件をNew Relicを使ったオブザーバビリティによって満たしています」(荒川氏)

DataHubは、オーケーが内製で開発したデータ連携基盤である。サーバーレスのイベント駆動型のアーキテクチャを採用しており、特定のイベント発生時にデータ加工などのファンクション(プログラム)が起動される仕組みになっている。オーケーはすでに、データのインプット/アウトプットのプロセス合計で約800本のプログラムをこの基盤上に構築している。

異常原因を即座にとらえてユーザー体験を向上

New Relicによる観測は、さまざまな効果をオーケーにもたらしている。

「例えば、ネットスーパーのシステムはリリース当初、ページ遷移や決済処理の性能が悪いといった課題がありました。ただ、New Relicを使った観測により、特定のAPIコールが幾度も無駄に行われているといったソフトウェア設計上のミスが性能の悪さにつながっていることが即座に判明し、スピード感をもって対処することができました。ユーザーから問い合わせが来ていた決済時のページ遷移時間も半分以下に低減され、関連の問い合わせを受けることがなくなりました。また、ネットスーパーのシステムと同様に会員アプリについても、New Relicを使った24時間365日体制の監視を行っており、異常の発生を速やかにとらえられるようになっています」(長岡氏)

New Relicによる観測は、DataHubの異常検知においても有効に機能している。

「DataHubのようなサーバーレスシステムの状態をリアルタイムにとらえられることは、オブザーバビリティソリューションであるNew Relicの大きな利点といえます。その利点を生かしながら、当社ではDataHubにおける日々のコールをチェックし、異常があった際にはメールやチャットツールを通じて開発チームのメンバーに知らせ、異常原因の調査と対処にあたってもらっています。アラートが発せられた際の原因の調査・特定が速やかに行われ、ダッシュボードを介した定常的な監視もしやすいと感じています。また、DataHubが扱うデータ量はかなりのペースで増えているので、データベースに対する負荷の上昇やCPU使用率の上下動をチェックするのも重要になっていますが、New Relicによって、そうした変化も一目で確認できます」(荒川氏)

マルチベンダーによる各システムの状況を一元的に可視化。障害対応プロセスを“あるべき姿”へ

以上のとおり、オーケーではネットスーパーシステム、会員アプリ、DataHubへオブザーバビリティを適用しているほか、クラウドに移行した物流・在庫管理、仕入・買掛管理、青果業務などのシステムの観測も行っている。今後は水産業務や精肉業務用のシステムもクラウドに移行し、New Relicによる観測を適用する計画だ。

その計画と連動し、インシデント管理やシステム品質の管理を強化するプロジェクトも進められている。

「当社では、システム異常に関する本社ユーザーや店舗からのお問い合わせと、システムからのアラートを1つに集約し、インシデント管理やサービス品質の管理の強化に生かすプロジェクトを推進しています。その中で、New Relicからのアラートを現在使用している運用管理プラットフォームに連携させ、全体の状況を見える化する作業に取り組んでいます」(オーケー IT本部 ITサポート部 部長 中西 美加氏)

nakanishi-sama

IT本部 ITサポート部 部長 中西 美加氏

この取り組みは、New Relicで障害対応プロセスをあるべき姿に近づける試みでもある。

「これまで異なるツールを使って社内システムの監視を行っていたため、アラートもバラバラに上がってくる状態でした。そのため、各アラートに対しての対応履歴を一元管理・可視化したり、障害対応のプロセスを標準化したりすることが困難でした。それが今日では、当社が運用するほぼ全てのシステムの観測がNew Relicで実現されつつあります。今後は、種々の監視ツールをNew Relicに統合し、そのアラートを運用管理プラットフォームなどに連携させるだけでなく、対応の履歴を確実に記録し、一元管理・可視化できるようにしていきます。これはIT本部が目指してきた障害対応プロセスの理想形であり、New Relicの導入でその姿にかなり近づけていると感じています」(荒川氏)

さらに同社では、障害へのプロアクティブな対応も視野に入れている。

「New Relicによる観測によって、各システムの異常を事前に察知し、プロアクティブに対応できるようになると期待しています。以前は、開発・提供元である協力会社が異なる多様なシステムを一元的に監視すること自体が難しく、それぞれの異常を事前に察知できるようになるとは考えていませんでした。それを実現可能にしてくれるNew Relicには、これからも期待しています。New Relic日本法人による手厚いサポートも引き続きお願いし、活用のレベルをさらに高めていきたいと考えています」(荒川氏)