Gettは、陸上交通を利用した出張旅行サービスを企業に提供する優れたプラットフォームを運営する会社です。同社の高度な技術は、企業の出張をより簡単で安全、効率的なものにしています。  同社のモビリティソフトウェアは、顧客が選択した配車アプリと自動車サービスを単一のSaaSプラットフォームに統合しているのが特徴で、企業の社員の出張の在り方を変革しています。2010年、Gettは世界初のオンデマンドB2Bモビリティサービスを開始し、同社のソフトウェアは、フォーチュン500企業の3分の1を顧客に持つまでになりました。

Gettの国際業務を円滑に運営するうえで、インシデント管理を迅速に行うことは非常に重要です。ダイナミックなマイクロサービス・クラウド・アーキテクチャーを採用すると、運転手と乗客に影響を与える運行実績上の問題を把握して修正する作業は複雑になりますが、優秀な人材を擁する同社のチームは、New Relicのオブザーバビリティを活用することで課題に対応するだけでなく、優れたデジタルエクスペリエンスを提供することを可能にしました。

99%のサービス品質保証(SLA)に対応

Gettの主要な課題の1つは、技術の信頼性を確保し、特に企業で予期しないトラフィックの急増が発生した時に、99%以上の運転手と乗客がいつでもサービスを利用できるようにすることです。

こうしたシナリオでは、技術サポートやインシデント管理などの研究開発チームが、技術開発、展開、監視方法、運転手と乗客に与える影響に関して、顧客担当チームと緊密に連携することが必要不可欠です。

デジタルサービスを利用するすべての人がどのように利用しているかを、リアルタイムで包括的かつ迅速に把握することは、最も重要なことです。ところがGettには5年前まで、適切な技術サポートチームも、適切な監視ツールを備えた正確なインシデント管理プロセスもありませんでした。

Gettのグローバル技術サポート・マネージャーであるダニー・コンスタンティンオフスキ氏は、当時を次のように振り返ります。「問題が発生したとき、最初に連絡してくるのは現場でした。運転手は当社の顧客ケアチームに電話をかけた後、今度は私たちに電話をかけ直していました。それは問題を解決するための最善の方法ではありませんでした。」

グローバル・インシデント・マネージャーのリオール・アヴニ氏は、エスカレーションを必要とする重大なインシデントが発生したときは、常にコンスタンティンオフスキ氏と緊密に連携しており、次のように付け加えます。「私の考えでは、当時の仕組みは失敗でした」 

それ以来、当社は優れた顧客エクスペリエンスを提供するため、多くの時間とリソースを投じてきました。

より具体的には、組織化、サービスのマッピング、アラートの欠落などといった多くの課題に何年にもわたり対応していました。私たちはあらゆる問題に一つずつ対応しました。「そのため、現在残されている課題は2つだけです。それは、問題の理解に要する平均時間と問題の検知に要する平均時間を短縮することです。」

24時間365日体制で作業するチームにとって、問題解決までの平均時間の短縮は必須です。ただし、コンスタンティンオフスキ氏が指摘するように、実際の課題をもたらすのは本番環境の規模です。「当社はマイクロサービス・アーキテクチャーに取り組んでおり、当社のシステムには200種類近いマイクロサービスが存在しています。あるサービスがダウンすると、通常はバタフライ効果と連鎖反応が起こるため、問題(Gettでは「火災」と呼ばれています)を解消するための情報源をすばやく見つける必要があります。

アヴニ氏はさらに次のように述べています。「私たちのプロダクション・システムの広がり、長さ、幅は成長し続けています。課題は、非常に多くのサービスとハードウェアを監視し、業務を組織化された方法で遂行することです。」

マイクロサービスのオブザーバビリティという課題への対応

Gettは主要なAWSユーザーとして、過去に様々なモニタリングツールを利用してきました。それらのツールは有用でしたが、要求を完全には満たしていませんでした。Gettがインシデント管理と強力なデジタル顧客エクスペリエンスの提供方法を改善するためにNew Relicを選択して適用範囲を拡大する決め手となった理由は、New Relicが同社のすべてのマイクロサービスに対して完全にリアルタイムなオブザーバビリティを持つことでした。

「New Relicは私たちの業務を以前よりもはるかに楽なものにしてくれています。New Relicを積極的に活用し、どのサービスが影響を受けているのか、その理由は何か、何をすべきなのかを正確に把握することで、問題を正確に特定することができます。マイクロサービスでは、1つのサービスがダウンしたときに、それがどのような影響をどこに与えているのかを正確に理解する必要があります。New Relicはこうしたオブザーバビリティを与えてくれます。New Relicがなければ、私たちが業務を遂行するのは極めて困難です」

「マイクロサービスでは、1つのサービスがダウンしたときに、それがどのような影響をどこに与えているのかを正確に理解する必要があります。New Relicはこうしたオブザーバビリティを与えてくれます。New Relicがなければ、私たちが業務を遂行するのは極めて困難です。」

ダニー・コンスタンティンオフスキ氏、Gettグローバル・テクニカルサポート・マネージャー

Gettがサービスを管理する上で、完全なオブザーバビリティを持つことが重要なため、同社のチームは、New Relicの適用範囲を当初のアプリケーション監視からロギング機能を備えたNew Relic Oneへ拡大しました。 New Relicを使って監視ツールを統合することで、チームの問題の把握が効率化され、コストも削減できるとコンスタンティンオフスキ氏は説明しています。 

「私たちは、ELKなどのロギングツールを使用していましたが、使い方が複雑だと感じていました。そのため、New Relicにログを追加することで、初めてすべてが同じシステムで管理され、問題の把握や特定が非常に容易になったので、「すごい」と思いました。」

アヴニ氏は次のように付け加えます。「複数のツールを切り替える必要がないため、インシデントを管理する際の貴重な時間を節約でき、問題を理解するための平均時間の短縮に役立っています。New Relicはあらゆるサービスの管理に役立つだけでなく、サービスを担当する実際のエンジニアへの通知チャネルを構築するのにも役立ち、今では私の一押しのインシデント管理ツールとなっています。New Relicが特定のアラートを発出してくれるため、アラートを微調整すると、検出に要する平均時間が以前の5分から2分未満に短縮されます。」

New Relicはあらゆるサービスの管理に役立つだけでなく、サービスを担当する実際のエンジニアへの通知チャネルを構築するのにも役立ち、今では私の一押しのインシデント管理ツールとなっています。New Relicが特定のアラートを発出してくれるため、アラートを微調整すると、検出に要する平均時間が依然の5分から2分未満に短縮されます。

リオール・アヴニ氏、Gettグローバル・インシデント・マネージャー

最前線のチームにとって信頼できる唯一の情報源

毎日数百万人ものユーザーが使用するサービスを管理するには、予期せぬイベントによる顧客需要の突然の変化を考慮に入れなければなりません。そのためチームは、プレッシャーの中で技術がどのように機能しているかに、極めて敏感に反応しなければなりません。

「ロシアでワールドカップが開催されたときに実行したように、私たちは主要なイベントへの準備を整えることができます。しかし、時間が経ってから利用件数が極端な嵐のように急増したり、競合他社の1社に技術的な問題が起こり、それがより多くの顧客に当社のアプリの使用を選択させるという予期せぬ事態につながったりすることがあります。New Relicは、こうした膨大な利用件数の増加がどこで起こり、どこでハードウェアと処理能力を追加すべきかを正確に把握するのに役立ちます」とコンスタンティンオフスキ氏は説明しています。

オブザーバビリティな速度と精度は、こうしたインシデントの管理方法のダイナミクスを変え、Gettはより積極的に対応できるようになりました。 

「問題をより早い段階でより明確に可視化することで、運転手が顧客ケアチームに電話をかけた時点でチームは既にこの電話を受ける準備ができ、チームは運転手に『問題に対応している』と自信を持って伝えることができます。New Relicの大きなメリットは、エンドツーエンドのインシデント問題の解決に私たちが力を合わせて取り組むうえでNew Relicが役立つことです」とコンスタンティンオフスキ氏は述べています。

こうした総合的で信頼できる唯一の情報源をNew Relic Oneを通じて得たことにより、インシデント管理チームと開発チームは、優れたデジタルエクスペリエンスを提供するという主要な目的の達成に向けてより緊密に連携することが可能になっています。

研究開発責任者のレナ・カッツ氏が言うように、「Gettでは、研究開発部門の開発者がサービスの所有者 (オーナー)です。開発者には幸せになってもらいたいし、必要のない時にポケベルが鳴るのは困ります。New Relicを使用すると、200以上のすべてのマイクロサービスで状況を非常に明確に確認できるため、何が起こっているのか、どのマイクロサービスで問題が起こり始めたのかを正確に把握できます。そのため、私たちは適切な開発チームに警告を発出することができます。」

技術サポートチームは技術の専門家ではないため、New Relicがいかに明確な指針でチームを指揮するかが非常に重要となるため、この連携は重要です。コンスタンティンオフスキ氏は次のように説明しています。「New Relicは、問題を正確に特定するのに役立ちます。どのマイクロサービスに問題があるのかだけでなく、その問題をどのエラーがどのサービスにもたらしたのかも特定できます。そのため、私たちが、開発者に連絡するときは、特定のエラーへのリンクを送ると、より早く問題を解決できるようになるのです。」

開発者自身が、本番環境に移行する際にNew Relicがいかに役立つかを理解しています。

「私は研究開発エンジニアに対して常に、新しい機能は素晴らしいが、既存の機能が動作しなければ、誰が新機能を気にするのだ』」と言っています。アヴニ氏は次のように述べています。「顧客エクスペリエンスは一流である必要があります。重要なのはそれだけです。それは「すべて」ではなく、「唯一のもの」です。New Relicのダッシュボードは非常に役立っています。研究開発エンジニアにダッシュボードを見せると、彼らは「なるほど」と思います。エンジニアは全体像を既に把握しており、ボタンをクリックするだけで修正するべき最も厄介なトランザクションを確認できるからです。

Gettは、熟慮を重ねたインシデント管理プロセスを備えた強力な連携チームを結成するとともに、メンバー全員が協力して作業するために不可欠な手段としてNew Relicを採用しました。この結果、平均復旧時間(MTTR)は50%短縮されました。

コンスタンティンオフスキ氏は次のように総括しています。「NewRelic Oneを開くと、問題が発生している場所、問題の発生したマイクロサービスに基づいてビジネスが受ける影響を即座に把握できます。さらに、何が当社の顧客ケアチームとお客様に影響を与えようとしているのかを理解できます。これにより、インシデントを円滑に管理する際にチームメンバー全員が力を合わせることができます。」

カッツ氏は、テクノロジーを活用してビジネスの可能性を広げるうえでNewRelic Oneがますます必須のソリューションとなっていると考えています。

「当社はお客様に対して99%という最高レベルのSLAでサービスを提供することをお約束しています。そのため、問題をできるだけ早期に検知し、その場で解決できる必要があります。それが、当社のアプリケーションを観察するためにNew Relicに投資してきた理由です。New Relicの持つオブザーバビリティで、当社のサービスで何が起こっているのかをいつでも理解できます。」

「当社はお客様に対して99%という最高レベルのSLAでサービスを提供することをお約束しています。そのため、問題をできるだけ早期に検知し、その場で解決できる必要があります。それが、アプリケーションを観察するためにNew Relicに投資してきた理由です。New Relicの持つオブザーバビリティにより、当社のサービスで何が起こっているのかをいつでも理解できます。」

レナ・カッツ氏、Gett研究開発部門責任者

New Relicを無料で。期間無制限です。

スタックをモニタリングできる弊社プラットフォームの全機能アクセスと、月あたり100GBのインジェストを無料で提供します。クレジットカードは不要です。