ぐるなび|モダンアーキテクチャーへの移行とSREの実践を通じた、フルサイクル開発者チームへの変革

ぐるなび様_集合

利用用途

「ぐるなび」ブランドの飲食店情報サイト、飲食店支援サービスにおける、システムのコンテナ化/クラウド移行と、SRE活動を組み込んだフルサイクル開発者チームへの変革にNew Relicを活用

New Relicの選定理由と成果

  • コンテナおよびAmazon ECS/EKS環境に最適なオブザーバビリティ環境の整備
  • 開発エンジニア主導でDevSecOpsを実践するフルサイクル開発者チームを指向
  • 発展途上のエンジニアチームをイネーブリングSREがサポートする体制を確立
  • SREの実践を通じて、システム、プロダクト、エンジニアチームを一貫してモダン化
  • サービス改善にBiz-Devが一体となって取り組むために全社1,000ユーザーがNew Relicを活用

利用製品

  • New Relic APM
  • New Relic Alert
  • New Relic AWS Integration
  • New Relic Browser
  • New Relic Dashboard
  • New Relic Mobile
  • New Relic Synthetics
  • New Relic Vulnerability Management

 

 

 

 

食でつなぐ。人を満たす。――新たに制定したパーパスのもと、株式会社ぐるなびが「食」の総合サービス企業としてのポートフォリオを拡充させている。その先に描かれているのは、「食」に関わるあらゆる人とビジネスをつなぐプラットフォーマーへの進化である。中核事業である飲食店情報サイト「ぐるなび」は、月間ユニークユーザー数3,800万人*1、会員数2,399万人*2、総有料加盟店舗数42,909店*3という業界屈指の規模へ成長を遂げている。同社 CTO 岩本俊明氏は次のように話す。

「飲食店情報サイト『ぐるなび』とともに力を注いでいるのが、飲食店様の経営と業務を支援する多様なサービスです。モバイルオーダーシステム『ぐるなびFineOrder』では、来店したお客様にはスマートフォンによるスムーズな注文と会計を、飲食店様には店内オペレーションの効率化やお客様単価の上昇に貢献するサービスとして支持を拡大しています。2022年のリニューアルでは、UI/UXを見直して使用感を大きく改善するとともに、システムをモダンなアーキテクチャーに移行してリアルタイム処理性能を向上させました」

*1:2022年12月時点
*2:2023年4月1日時点
*3:2023年3月時点 

 

ぐるなび 岩本様

CTO  岩本俊明氏

ぐるなびでは、2019年より主要サービスのコンテナアプリケーション化とクラウドへの移行を進めている。モダンなクラウドインフラの整備をリードしているのは、Server Infra Unit Engineering Leadの吉田満氏である。

「クラウドインフラの整備・移行・運用とともに、SRE(Site Reliability Engineering)への取り組みを本格化させています。『ぐるなびFineOrder』のようなサービスでは、お客様がメニューの参照から、料理やドリンクの注文、会計までを快適に行えることが最も重要です。お客様体験とサービス品質を常に把握しながら、システムの信頼性向上を目指すSRE活動は必須でした」

ぐるなび 吉田様

開発部 Infrastructure ServiceS Server Infra Unit Engineering Lead 吉田満氏

飲食店情報サイト「ぐるなび」がサービスを開始したのは1996年。システムは長年にわたりオンプレミスで構築・運用されてきた。だが、急速なビジネス成長とサービス拡大の過程で、サービス機能をタイムリーに拡充させたいビジネスチームと、思うように開発生産性を高められないエンジニアチームの双方でシステムに起因する課題が顕在化していたという。

「システムのモダン化は必須でしたが、システムだけをモダン化しても意味がありません。システム、チーム、そしてビジネスがモダンになる必要があると考えています。私たちが目指したのは、モダンなシステムを使ってお客様に価値の高いサービスを提供し、モダンなエンジニアチームがスピーディにプロダクトを開発・改善し、モダンなツールを使って高品質なサービスを提供し続ける体制です。この変革に不可欠なのがSREの考え方であり、SRE活動を支えるオブザーバビリティプラットフォームNew Relicでした」(岩本氏)

 

オブザーバビリティを備えたモダンなシステムへ移行を推進

マイクロサービスアーキテクチャーを採用したモダンな新システムは、Amazon Elastic Container Service(ECS)およびAmazon Elastic Kubernetes Service(EKS)を基盤に整備された。ぐるなびでは、年度単位で大規模な移行プロジェクトを進めており、将来的には全プロダクト/サービスのコンテナ化とクラウド移行を目指している。

「変更の難しかったモノリシックなアプリケーションを、新システムではフロントエンド-BFF-バックエンドに分離して疎結合化し、フロント側にコンテナ/Kubernetesを採用して機能アップデートや改修を容易にしています。このようなマイクロサービスアーキテクチャーによる新システム全体を可視化し、サービス品質とお客様体験を向上させるためにNew Relicを活用しています」と岩本氏は話す。

New Relicは業界を代表するオブザーバビリティプラットフォームであり、国内では39%のトップシェアを獲得している。デジタルサービスにおけるあらゆる重要指標の「観測」を可能にし、アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する。ぐるなびでは、SREのミッションを担う吉田氏のチームをはじめ、エンジニアチーム全員がNew Relicを活用している。

「モダンなシステムがオブザーバビリティという能力を備えることで、運用監視スキルのない開発エンジニアでもサービスやシステムの状態を把握できるようになりました。ぐるなびではプロダクト/サービス単位でアプリケーション開発チームを編成していますが、いち早く新システムに移行した先鋭的な開発チームでは自分たちのスコープにSRE活動を組み入れてDevOpsを実践し、チーム内で問題の検知から解決までを完結できる体制を整えています。一方、SRE活動をまだ定着化できていない開発チームには、私たちがイネーブルメントSREとしてトレーニングやアドバイスを提供しています」(吉田氏)

フルサイクル開発者チームへの進化を加速

吉田氏が話した「先鋭的な開発チーム」は、DevOpsの最新トレンド「フルサイクル開発者チーム」そのものと言っていい。「アーキテクチャーと開発チームは合致する」というコンウェイの法則の通り、「モダンなシステムを完全に使いこなすためには、モダンなエンジニアチームが必要」なのだ。「フルサイクル開発者」は、DevOpsのフルサイクルを高速に回していくために必要なエンジニア機能を、開発者または開発チームが備える考え方である。

 

DevOps

「検索サービスのリニューアルが、コンテナアプリケーションによる『モダンなシステム』の最初の成功例となりました。これを担当したエンジニアチームでは、開発フェーズでNew Relicを活用してアプリケーションの品質を高めるとともに、運用フェーズでは問題解決やサービス品質の向上に役立てています。New Relicの活用が進み、チームがフルサイクルの機能を強化する過程でDevOpsのサイクルはさらに高速化しています」と岩本氏は話す。

新たに構築されたモダンなシステムには、New Relicによるオブザーバビリティが全面的に適用された。CloudWatchで収集されたメトリクスやログも、New Relicのダッシュボードから統合的に参照できる環境が整えられている。

「New Relic APMとNew Relic Browserによるユーザー体験の観測は非常に重要です。Webサイトの健全性を示す指標Core Web Vitalsを利用してページや機能ごとにユーザー体験を定量的に評価し、ビジネスチームとともにサービス品質の改善に役立てています。並行してSLI/SLOの運用を進めており、ここではNew Relic SLMを有効に活用しています」とServer Infra Unit Tech Leadの飯田健介氏は話す。

ぐるなび 飯田様

開発部 Infrastructure ServiceS Server Infra Unit Tech Lead  飯田健介氏

開発チームによるNew Relicの活用が進むことで、吉田氏が率いるクラウドインフラチームの役割も少しずつ変わりつつあるという。

「何らかの問題が発生したときに開発者自身が原因を特定できるようになり、問い合わせの件数は大幅に減りました。原因特定の難しい問題に関しては、New Relicの観測データを確認しながら協力して解決に取り組めるようになっています。私たちのチームでは、イネーブリングSREとしての業務により多くの時間を割り当てられるようになりました」(吉田氏)

「Flutterで開発中のスマートフォンアプリへのNew Relic Mobileの実装にも着手しました。これが達成されると、インフラやアプリケーションの状況からユーザー体験まで、サービス/プロダクトを網羅的に可視化できる環境が完成します」(岩本氏)

ぐるなび全社1,000ユーザーがNew Relicを利用可能に

ぐるなびでは、エンジニアチームだけでなく、ビジネスチームもNew Relicを活用しており、導入規模は全社で1,000ユーザーに達する。ユーザーはシングルサインオンでNew Relicを利用できる。岩本氏はその狙いを次のように話す。

「New Relicは、サイトのサービス品質やソフトウェア開発の生産性を定量的に示すことができます。ビジネスチームにモダン化の意義を理解してもらうには、『Core Web Vitalsのスコアがどれだけ改善したか』『リリースサイクルがどれだけ短縮したか』を示すことが効果的です。現在では、New Relicのダッシュボードを見ながらサービス改善について議論できるまでになりました」

モダンなエンジニアチームには高いモチベーションが欠かせない。岩本氏は、New Relicがエンジニアとそのチームに与える影響を次のように話す。

「これまでは、エンジニアの日々の活動は見えにくく、ビジネスサイドの理解や評価を得るのはなかなか難しかったと思います。New Relicの導入によりサービス品質、お客様体験、開発生産性が定量化され、誰もがいつでも見られる状態ができたことで、エンジニアの『頑張り』は正しく評価されやすくなりました。エンジニアがより高い意識を持ってチャレンジできる環境は着実に整えられています」

モダンなテクノロジーをいち早く活用してアイディアを具現化

New Relicは、モダンなエンジニアチーム、フルサイクル開発者チームを支援するための機能強化を着実に進めている。生成AIによるオブザーバビリティアシスタント「New Relic Grok」、ライブラリなどの脆弱性管理を支援する「New Relic Vulnerability Management」はその代表例だ。

「New Relicの活用レベルは、まだエンジニアやチームによって差があるのが実情です。New Relic Grokのような先進機能が、オブザーバビリティを使いこなすためのハードルを下げ、開発チームのSRE活動をさらに加速させてくれるものと期待しています。ぐるなびのバリューチェーンをより良いものにしていくために、ビジネスチームとエンジニアチームが協力するための共通言語として、全社レベルでNew Relicの活用が進むことを目指してSRE活動をサポートしていきます」とServer Infra Unitの遠藤耕平氏は話す。

ぐるなび 遠藤様

開発部 Infrastructure ServiceS Server Infra Unit SRE 遠藤耕平氏

岩本氏は、「脆弱性管理のようなセキュリティ機能の強化は、SRE活動の役割を高めるうえで重要な進化であり期待は大きい」と評価しつつ次のように結んだ。

「New Relicを採用した決め手のひとつに『進化のスピードの速さ』がありました。私たちがOpenAI GPTアプリケーションの開発に着手したとき、すでにNew Relicが対応していたことには驚かされました。私たちは、『モダンなテクノロジーをいち早く活用してアイディアを具現化したい』と常に考えており、新しいチャレンジを始めるにあたってNew Relicを即座に適用できることは大きな安心です。プロジェクトではNew Relicの技術チームに何度も助けられました。これからも適切なアドバイスとサポートを期待しています」