利用用途
6年連続でトップシェアを獲得している保育業務支援SaaS「CoDMON」のメインシステムのモダン化、アプリケーションの品質向上、より良いユーザー体験の実現にNew Relicのオブザーバビリティを活用
New Relicの導入目的と成果
- ユーザー数を基本とするコストを見通しやすいライセンス体系
- CoDMONのメインシステムからスマホアプリまでを一貫したユーザー体験の可視化
- コンテナ化/マイクロサービス化の推進とモダンアプリケーションの可視化
- CoDMONのサービス安定化、問題発生時の原因特定から解決までの迅速化
- ビジネスが急成長する中でSREチームの負荷低減に貢献
- アプリケーション開発チームへのSRE活動の定着化
- コアデータベースのチューニング、データモデルの最適化にNew Relicの観測データを活用
利用製品
- New Relic APM
- New Relic Mobile
- New Relic Browser
- New Relic Synthetics
- New Relic Infrastructure
- New Relic Logs
- New Relic Dashboard
すべての先生に子どもと向き合う時間と心のゆとりを――CoDMONは、保育・教育の現場で高い評価を得ているクラウドサービスである。全国47都道府県で2万施設を超える導入実績*を持ち、毎年2千以上の施設に新たに導入されている。(*2024年10月時点)株式会社コドモン プロダクト開発部 SREリードエンジニアの田中知英氏は次のように話す。
「CoDMONは、保育園・幼稚園・学童保育などの施設で職員の業務を支援するICTシステムであり、保護者と施設のコミュニケーションの円滑化にも貢献します。園児や児童の出欠管理を容易にしたり、保育時間の延長申請から精算までのフローを自動化するなど、業務の質を落とさずに施設職員の負荷を低減できることが大きな特徴です。施設の方からは『時間と心にゆとりが生まれ、保育・教育の質の向上に結びついている』という声をいただいています」
CoDMONは保育・教育施設向けICTシステムとして、6年連続で国内トップシェアを獲得した。そのユーザー満足度の高さは、99.8%というサービス継続率*に裏づけられている。(*2023年実績)
「2015年にサービスを開始したCoDMONは、現在では全国2万を超える保育・教育施設で日々活用されるまでに成長し、施設を利用する保護者の方々にとっても欠かせないツールとなりました。保護者アプリのユーザーは約315万人に達します。ユーザー数の増大とともにサービスの安定提供に対する要求レベルも高まっており、システムの安定運用を担うSREチームのミッションはいっそう高度化しています」(田中氏)
コドモンでは2021年にオブザーバビリティツールを初めて導入し、CoDMONメインシステムのインフラ監視と外形監視に着手した。当初の狙いは、MSPへの運用委託から自社運用への切り替えだった。
「マイクロサービスアーキテクチャによる新機能開発、メインシステムのモダン化を本格化させたのも2021年です。私たちは、SREチームが横断的に担ってきたシステム監視を、プロダクト・機能ごとに編成されたアプリケーション開発チームに移管する方針でオブザーバビリティツールの活用を進めていきました。2022年からはAPMを利用できるようになったことで、モニタリングやSRE活動に対する開発エンジニアの意識が次第に高まっていく手応えを感じていました」と田中氏は振り返る。
だが、SRE活動をさらに深化させ「バックエンドからスマホアプリまで、一貫してユーザー体験を観測したい」「コンテナ環境を深く観測するために、より多くの機能を利用していきたい」と田中氏が考えたときに、オブザーバビリティツールのコスト増という難題が立ちはだかったという。
「従量制で、監視対象や利用機能を増やすごとに課金されるライセンス体系では、持続的なビジネス成長を目指すCoDMONのコスト負担が増え続けることは明らかでした。オブザーバビリティツールのコスト構造を見直す過程で、私たちが注目したのがNew Relicです」
2023年、田中氏らSREチームは既存のオブザーバビリティツールからNew Relicへの乗り換えを断行した。
SRE活動の将来を見据えてNew Relicに移行
New Relicは業界を代表するオブザーバビリティプラットフォームであり、国内では46%のトップシェアを獲得している。デジタルサービスにおけるあらゆる重要指標の「観測」を可能にし、アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する。田中氏が評価したのは、「ユーザー数(定額制)」と「取り込んだ観測データ量(従量制)」でコストが決まるNew Relicのライセンス体系だった。
「ユーザーライセンスを基本とするNew Relicでは、監視対象の数に上限はなく、フル機能を利用できるメリットを高く評価しました。コストを適正にコントロールしながら、ユーザー体験の観測をスマホアプリまで拡大したり、コンテナ環境を可視化するといったSREチームがやりたかったことを制限なく実行できるようになりました」と田中氏は話す。
また、New Relicの従量制では「年間契約消費型モデル」を採用しており、例えばある一定期間、想定したデータ消費量を超えたとしても、改めて調整費用として追加するのか、超過している分のデータ転送を止めるのかを判断することができるため、いきなり想定を超えるような自動請求が行われることはない。
「現在、SREチームでは『アプリケーション開発チームにSRE活動を定着化させ、開発エンジニア自らがプロダクトとサービスの品質向上に取り組む体制を確立する』という基本方針を掲げています。そのために、80名を超える開発エンジニア全員にNew Relicのフル機能を使えるライセンスを提供しています」(田中氏)
テクニカルアカウントマネージャーによる技術支援
SREチームは、CoDMONメインシステムのインフラ整備、モダン化、日々のモニタリングを担いながら、アプリケーション開発チームにおける「SRE活動の定着化」に力を注いできた。その背景には、ビジネスの急成長に伴うシステム規模の拡大、監視対象の増大、そして開発チームの陣容拡大があった。プロダクト開発部 SREエンジニアの三口宗武氏は次のように話す。
「開発チームごとにダッシュボードを開発し、SREが開発チームに入って使い方をレクチャーしながら既存のオブザーバビリティツールの活用を進めてきたのですが、開発チームが80名規模になり、きめ細やかな対応が次第に困難になっていきました。SREチームがボトルネックになって、開発に影響を及ぼすような事態は回避しなければなりません。開発チーム自身が、自分たちのプロダクトや機能の安定稼働に能動的に取り組む体制を確立する上で、New Relicテクニカルアカウントマネージャー(TAM)による技術支援には大変助けられました」
SREチームがNew Relicを高く評価したもう一つのポイントが、三口氏の言うTAMによる技術支援である。TAMは、コドモンが目指すべきオブザーバビリティ活用の理想像を描き、着実にステージを上がりながらその目標に近づくためのアドバイスを継続的に提供している。
「New Relicの適用システムを拡げたい、New Relicの新機能を使い始めたいといったケースや、実際のトラブルシューティングでもTAMからの適切なアドバイスに助けられました。アプリケーション開発チームでのSRE活動がかなり定着化してきた現在では、SREチームを介さずに、開発エンジニアがTAMと直接相談してアドバイスを受ける流れも確立されました」(三口氏)
また、New Relicが提供する「Game Day」と呼ばれる実践型トレーニングも、SRE活動の定着化に大きく寄与したという。このトレーニング開催の詳細については、コドモンプロダクトチームのブログ記事『New Relic Game Dayを社内で開催しました!』で詳しく紹介されている。
「実際に起こる可能性のあるシステム障害を疑似的に発生させ、その調査をチームで協議しながら、New Relicの機能や対処方法について理解を深める研修を数回にわたって実施してもらいました。Game Dayにおける実践的な体験を通じて、参加した開発エンジニア全員が新しい知識を持ち帰ることができたと思います。New Relicの担当者に全面的にサポートしてもらえましたので、研修の実施に際してほとんどSREチームの工数がかからなかったことも助かりました」(田中氏)
エンジニアが働きやすい環境づくり
コドモンでは、サービスの機能範囲ごとにDevOpsを担当するストリームアラインドチーム、共通基盤を内部サービスとして提供するプラットフォームチーム、各チームが技術的難易度の高い課題に対応する際に支援するイネイブリングチームという3つのチームからエンジニア組織が構成されている。イネイブリングチームのメンバーとして難易度の高い課題に取り組むことの多い吉田芳明氏は次のように話す。
「CoDMONのコアデータベースの負荷対策に取り組んでいるのですが、ここでもNew Relicが役立っています。New Relic APMでは、データベースのテーブル単位でどのAPIがどれだけの負荷をかけているのかが一目でわかりますので、どのテーブルから対処すべきか優先順位づけが容易です。今後は、データモデルの最適化に向けてNew Relicの観測データを有効に活用していく考えです」
CoDMONの成長と安定運用を支える基盤技術の整備など、様々な難題に挑む吉田氏にとってNew Relicにはどのような価値があるのか。
「システムの中で何が起きているのか、どこにどんな問題が起こっているのかを、いち早く理解できるようになったことが最も大きなメリットでしょう。エンジニアが、システム不具合の原因究明に長い時間をかけて取り組むような場面は確実に減っています。コドモンは、保育・教育の現場を支援するCoDMONを開発・提供する立場として、自分たちのワークライフバランスを重視した働き方を推進しています。今後もNew Relicが、エンジニアによるスムーズな課題解決の助けになってくれると期待しています」(吉田氏)
SRE業務に携わる三口氏は、New Relicの使い勝手の良さを次のように実感しているという。
「NRQL(New Relic Query Language)を使えば、欲しい情報を見やすい形でダッシュボードに可視化できます。バックエンドからフロントエンドまでユーザー体験に関わる様々なデータを収集できますので、それぞれの関連性を明らかにすることで、より深い洞察が得られるよう使いこなしを進めていきたいと考えています」
エンジニアリング本部におけるNew Relic活用の進展を肌で感じ、「New Relicに乗り換えた判断に間違いはなかったと確信している」と話しつつ田中氏は次のように結んだ。
「モダンなコンテナアプリの監視を強化すること、トラブルシューティングとパフォーマンス改善に活用すること、そしてSREチームのサポートなしに開発チームがNew Relicを使えるようにすること――これらの目標はほぼ達成することができました。今後は、エンジニアリング本部全体でアプリケーションモニタリングを深化させ、協力してより良いユーザー体験を作り込んでいきたいと考えています。TAMの方をはじめ、New Relic日本法人には、これからもCoDMONの成長と安定運用を支え続けてもらえることを願っています」