先週より連続して投稿してきた分散トレーシングに関するブログの連続投稿の最後として、昨日のブログで紹介したheadベースサンプリングの分散トレーシングをクラウドネイティブなサービスとして提供する「New Relic Edge」の発表を、2020年5月5日に投稿された「Announcing New Relic Edge with Infinite Tracing」を抄訳してお伝えします。

New Relicは、ガートナー社のPeer Insightsによると、最も包括的なAPMソリューションを提供し続けています。

今日では、このリーダーシップをさらに強化し、複雑なオンプレミスのトレースソフトウェアの運用負担を軽減しながら、分散システムの比類のない可視性をお客様に提供しています。

従いまして、「無限」のトレースを兼ね備えたNew Relic Edge(New Relic Edge with Infinite Tracing)を紹介するのにワクワクしています。New Relic Edgeは、アプリケーションのトレースを100%観測し、最も実用的なデータの可視化と保存を提供することで、既存の分散型トレースソリューションを凌駕するものとなっています。このサービスは、完全に管理されたクラウドネイティブのサービスとして提供され、無制限のオンデマンド拡張性を備えています。

柔軟性が高く、複雑さが少ない

最新のマイクロサービスベースのアプリケーションを構築する開発者は、高度に相互接続された分散システムを担当しています。サービスの複雑性は高く、通常、さまざまなテクノロジー、フレームワーク、インフラストラクチャ、およびデプロイのメカニズムが関与しています。さらに、ほとんどの企業環境では、レガシーなモノリスアプリと最新のマイクロサービスベースのアプリが混在しています。

このような複雑さは、問題を追跡して解決しなければならないときに大きな頭痛の種となります。トラブルシューティングに使用するツールは、不必要な複雑さや手間を加えることなく、アプリケーションスタックと同じくらい包括的で俊敏なものでなければなりません。

手間をかけずにすべてを観察する

高スループットのマイクロサービスベースの分散システムでは、すべてのトレース遠隔測定を観察・分析し、最も実用的なデータを保存・可視化して、問題が顧客に影響を与える前に迅速なトラブルシューティングを行う必要があります。しかし、すべてのトレースを捕捉するために、追加の運用上の手間をかける必要はありません。勝利を収めている企業は、ビジネスの実行に集中しています。だからこそ、分散トレースの複雑なデータ挿入を管理し、ビジネスの成長に合わせて拡張し、エンジニアをより価値の高い取り組みに専念させるオンデマンドのフルマネージドサービスが必要なのです。以前の失敗を繰り返したり、代替手段のためにモニタリング・コンポーネントをセットアップしたりするためだけに、クラウドに移行して全てのオンプレミスをなくすことはしません。

データ送信で破産しないために

多くの環境では、分散型システム全体から送信されるトレーステレメトリーのスパンは、1分間に数千万、あるいは数億を簡単に超えます。データの送信料金(データ・ストレージの料金は言うまでもなく)は、あっという間に増えていきます。このため、ワークロードと同じクラウドリージョンに位置し、同じプロバイダーのサービスを利用することで、データ送信料金を最小限に抑えることが重要です。

どうして既存のアプローチでは不十分なのでしょう

単一製品のみ扱うプロバイダーやパッチワークのようにモニタリング製品をつなぎ合わせる他のベンダーは、複雑で使いにくいツールを作成してきました。分散システムの健全性とパフォーマンスをよりよく理解するためにこれらのツールを評価するソフトウェア・チームの多くは、その複雑さに不満を感じ、機能の不足に失望し、驚くほど高いコストにショックを受けることがよくあります。これらのツールはいくつか重要なポイントでうまくいっていないのではと考えます。

ソフトウェアチームへの不要な負担

パッチワークや単一製品のツールでは、複雑なオンプレミスのトレースインフラストラクチャやソフトウェアを展開、管理、拡張する必要があります。これらのツールは、ゲートウェイ、プロキシ、およびサテライトを運用するためにスタッフを配置し、計画を立てなければならないため、不必要な運用上の負担が生じます。これは、使用量の急増、回復力、コスト、規模などの計画に関わるすべての要素を考慮すると、信じられないほど困難な作業です。

データ出力とストレージの許容できないコスト

パッチワークや単一製品のツールでは、インターネットを介して膨大な量のトレース・テレメトリを送信し、保存する必要があります。これは、データ送信利用料がすぐに信じられないほど高額になります。さらに悪いことに、分散システム上のトランザクション・リクエストの圧倒的多数は問題なく完了します。自問自答しなければならないのは、「針にしか興味がないのに、なぜ干し草の山全部に金を払うのか」ということです。

圧倒的な機能に応じて増加する平均解決時間(MTTR)

パッチワークおよび単一製品ツールは、モバイル、リアル・ユーザー・モニタリング(RUM)、合成監視、およびその他の基本的なテレメトリ・データをトレース・テレメトリおよびビジネス・コンテキストと組み合わせて包括的な観測性を実現するための機能を備えて設計されていませんでした。つまり、問題をトラブルシューティングする際にツール間を飛び回る時間が増え、結果的に MTTR が劇的に増加します。

分散トレースの次の進化

New Relic Edge with Infinite Tracingは、完全に管理されたクラウドネイティブの新しいサービスで、ソフトウェアチームやDevOpsチームが分散トレースを使用して計測する方法を根本的に変えるものです。このサービスは、複雑なトレースソフトウェアの管理に伴う運用上の負担を完全に取り除くことができるため、エンジニアは、オンプレミスのコンポーネントの導入やスケーリングに伴う複雑さを気にすることなく、マイクロサービスを自由に計測してトレーステレメトリーを「無限」に測定できます。

この新しいサービスは、分散システム全体のすべてのアプリケーションのトレースを観測し、最も実用的なデータの可視化とストレージを提供するため、問題の調査と解決を迅速に行うことができます。管理するインフラストラクチャは不要です。サービスを運用するためのスタッフや計画を立てる必要がなく、他に類を見ないオンデマンドのスケーラビリティを提供します。

問題をすばやく見つけて修正する

分散システムのトラブルシューティングは、典型的な干し草の山の中の針のような問題です。New Relic Edge with Infinite Tracingは、エラーや高レイテンシのトレースに焦点を当てるなど最も重要なことに基づいて自動的にノイズを除去し、問題を迅速に発見して修正することができます。

完全に管理されたサービスにより、運用上の負担を排除

New Relic Edge with Infinite Tracingは、クラウドベースのワークロードと同じregion、同じプロバイダーに位置し、低レイテンシーで低コストのデータ転送を可能にする唯一のフルマネージドのクラウドネイティブデータ収集サービスです。つまり、データ送信料金を節約しながら、より多くのトレーシング・テレメトリを送信することができます。

クラウドローカルはコストの削減を意味

New Relic Edge with Infinite Tracingは、クラウドベースのワークロードと同じリージョンにあり、プロバイダーが同じ、完全に管理されたクラウドネイティブのデータ収集サービスです。これにより、低レイテンシで低コストのデータ転送が可能になります。つまり、データ下り料金を節約しながら、より多くのトレーステレメトリを送信できます。

オープンでベンダー中立の計測を完全にサポート

New Relicは、オープンなインストルメンテーション、サーバーレス機能、独自のエージェントなど、あらゆるソースからトレース遠隔測定を送信できる柔軟性を提供します。オープンソースであってもNew Relicエージェントであっても、作業に適した計測ツールを選択することができます。当社のプラットフォームはベンダーニュートラルであるため、これらすべてのソースに対してペナルティなく相互運用性を提供します。OpenTelemetry、OpenCensus GoOpenCensus Pythonなどの一般的なオープンソースのトレースツールや標準規格に加え、Istioのようなサービスメッシュツールもサポートしており、ベンダーニュートラルなプラットフォームとユーザーエクスペリエンスを提供することをお約束します。

headかtailか、あなたが選べます

New Relicは、ソフトウェアチームに権限を与え、アプリケーションに最適な分散トレースオプションを選択できる唯一のソリューションプロバイダーです。多くのチームが、レガシーなモノリスアプリケーションとマイクロサービスベースのアプリケーションを混在させて管理しており、それぞれに異なる監視要件があることを理解しています。New Relicを使用することで、ソフトウェアチームは、ヘッドベースのサンプリングによる標準的な分散トレースや、テールベースのサンプリングによる「無限」トレースを柔軟に選択することができます。

プラットフォームの力を活用する

New Relic Oneは、RUMインフラストラクチャログProgrammability、ダッシュボードなど、トレーシングのテレメトリーを完全な観測可能なデータと接続する機能を提供します。また、世界で最も強力なテレメトリーデータベース上に構築されているため、比類のない柔軟性と高速な検索・可視化機能により、エンドツーエンドの完全な可視性を得ることができます。

無限トレースを備えたNew Relic Edge:メリット

機能 お客様にとっての価値
New Relic Edge 機能
    • フルマネージドのクラウドネイティブエッジコレクションサービス
    • 無制限のオンデマンドの拡張性
お客様にとっての価値
    • 複雑なオンプレミスのトレース・ソフトウェアの管理負担を軽減
    • 使用量の急増やスケーリングの必要性を気にすることなく、全体からすべてのトレーステレメトリーを送信
無限トレース 機能
    • アプリケーションのトレースを100%キャプチャして分析
    • 管理されたテールベースのサンプリングアルゴリズムにより、最も実用的なトレースデータを可視化
お客様にとっての価値
    • エラーや異常なレイテンシがあるトレースを見逃さない
    • 複雑な分散アーキテクチャでのトラブルシューティングの高速化とMTTRの削減
クラウドローカル 機能
    • New Relic Edgeは、ワークロードと同じクラウドプロバイダーとクラウドリージョンにあります
お客様にとっての価値
    • 効率的で低コスト、低遅延のデータ転送
オープンソースの計測とサービスメッシュ 機能
    • オープンインストルメンテーションやサービスメッシュ(OpenTelemetry、OpenCenus、Istio)を含む任意のソースからトレースを送信します
    • W3C Trace Contextの完全サポート
お客様にとっての価値
    • ベンダーに依存しない計測ツールを利用し、ロックインを回避
    • コンテキスト伝搬の問題による壊れたトレースや孤立したスパンを排除できる
柔軟な分散トレース 機能
    • New Relicは、headベースとtailベースの両方のサンプリングソリューションを提供する唯一のソリューションプロバイダーです
お客様にとっての価値
    • 各アプリケーションのニーズに基づいて、最適な分散トレースソリューションを選択するための究極の柔軟性
異常検出 機能
    • 機械学習と高度な統計分析を含む一連のサービスを使用して、トレース内の異常に遅いスパンを自動的に強調表示します
お客様にとっての価値
    • 与えられた状況で何が普通なのか、何が異常で注意が必要なのかを迅速かつ正確に把握できます。
    • DevOps チームは、マイクロサービス環境をより迅速に理解し、トラブルシューティングすることができます。
配置マーカー 機能
    • 組み込みのデプロイメントマーカーは、上流または下流のサービスに対する特定のディプロイメントとのトレース動作の違いを相関させることでコンテキストを提供します。
お客様にとっての価値
    • 上流および下流の展開の変更による潜在的な影響を迅速に特定します。
グローバルトレース検索 機能
    • チームが特定のサービス内のスパンに追加することが多いカスタム属性を使用してトレースを見つけるためのシンプルかつ強力なツールです。
お客様にとっての価値
    • 分散型ソフトウェア環境におけるパフォーマンスの問題を解決するために、より迅速かつ効率的に作業を進めます。
New Relic One 機能
    • リアル・ユーザー・モニタリング(RUM)、インフラストラクチャ、ログ、プログラム可能性、ダッシュボードなどを含む、フルステートの観測可能性データとトレーシングテレメトリーを接続します。
お客様にとっての価値
    • 業界の他のプラットフォームとは異なり、New Relic Oneでは、すべてのエンティティや遠隔測定タイプを検索し、それらの関係性や依存関係をすべて確認し、ビジネスにとって何が重要なのかというコンテキストを理解することができます。

New Relic Edgeを使い始める

この弊社のフルマネージドサービスについてさらに詳しく知りたい方はドキュメントをご覧ください。

[embed]https://www.youtube.com/watch?v=-HDySWw-9Kg&feature=emb_title[/embed]