私達エンジニアは、常に優先順位を判断しています。本番環境で起きている問題、パフォーマンスの最適化、高負荷時でもシステムが安定するようにすること。現代のアプリケーションとそのインフラの複雑さは、多くの時間をログの精査、カスタムクエリの作成、散らばったインサイトの組み合わせに費やすことを意味します。そこに、New Relic AIが劇的な変化をもたらしました。大規模言語モデル(LLM)を活用することによって、より自然な方法でシステムデータを扱えるようになります。生データと格闘したり、複雑なクエリを作成したりすることなく、わかりやすい言葉で質問し、有意義かつ実用的な洞察をすぐに取得することができます。これは、ワークフローを簡素化し、本当に重要なことに注力できるようにする、真のゲームチェンジャーです。
このブログ記事では、New Relic AIにより私のエンジニアリング作業がより簡単に、より速く、そしてストレスが軽減される5つの方法を共有します。隠れた問題の特定、退屈なタスクの自動化、監視の合理化など、このツールがオブザーバビリティに対する私のアプローチをどのように変えたかをご紹介します。
1. 合理化されたデバッグ
デバッグは、特に大規模な分散システムを扱う場合、エンジニアにとって最も時間のかかる作業の1つになります。何か障害がおきたとき、最初に思いつくのはログを調べることですが、多くの場合、何百行、何千行のテキストを調べて、問題を突き止める作業になります。New Relic AIは、ログ分析を高速化するだけでなく、よりスマートに対処して状況を一変します。手動でログを検索する代わりに、New Relic AIにわかりやすい言葉で質問することができ、エラーの要約、パターンの強調、次のステップの提案をしてくれます。
高トラフィックのイベント中に広告サービスを扱っていて、いくつかのトランザクションが断続的に失敗し始めたとしましょう。複数のログファイルに飛び込むのではなく、以下のようにNew Relic AIにクエリします
ad serviceで一部のトランザクションが失敗するのはなぜですか?
New Relic AIは、New Relicクエリ言語(NRQL)でクエリを即座に生成し、以下に示すように、失敗したトランザクションのおおよその数を表示します。
ここからクエリをさらに調整して、エラーの種類と根本原因を特定します。単純に次のように尋ねるだけです。
これらのトランザクションが失敗するのはなぜですか?
AIは、クラス、メッセージ、数などエラーの詳細な内訳を返します。たとえば、失敗の原因がSQL接続の問題とタイムアウトであることが判明する場合があります。
上のスクリーンショットには2つのエラーがあります。
java.lang.Exception:SQL接続に失敗しました(接続が多すぎます)
。データベース接続の上限に達し、クエリが失敗したことを示します。java.util.concurrent.TimeoutException:コンテキストがタイムアウトしました
。外部サービスまたはリソースへのリクエストがタイムアウト閾値を超えていることを示します。
この簡単な概要を利用すれば、膨大なログの検索に時間を割く必要がなくなります。むしろ、接続のボトルネックを解決し、外部依存関係を最適化することに直接集中することができます。この機能により、貴重な時間が節約され、プレッシャーの高い状況での認知負荷が軽減されるため、問題をより迅速かつ効果的に解決できるようになります。
2. 自然言語を使用したNRQLクエリの作成
New Relicを使用している場合は、NRQLがテレメトリーデータのクエリの中核であることをご存知かと思います。システムメトリクスを分析している場合でも、エラーを追跡している場合でも、NRQLを使用すると、有意義なインサイトを抽出できます。ただし、特に時間に追われている場合や構文に慣れていない場合に、これらのクエリを作成すると生産性が低下する場合があります。New Relic AIでは、NRQLを暗記したり、手動で構築したりする必要はありません。代わりに、必要なことをわかりやすい言葉で説明すると、AIがクエリを生成します。
フロントエンドサービスを監視していて、サービスのレスポンスタイムを確認したいとします。パフォーマンスを分析するには、次のように尋ねるだけです。
過去1時間のFrontendサービスの平均応答時間はどれくらいですか?
New Relic AIは次のクエリを生成します。
同様に、単一のメトリクスに焦点を当てずに、サービスのパフォーマンス概要をクエリすることもできます。単純に次のように尋ねるだけです。
Payment Serviceのパフォーマンスを表示してください
New Relic AIは次のクエリを生成して実行します。
以下のスクリーンショットは、過去1時間のPayment Serviceでの平均継続時間やトランザクション数などのパフォーマンスメトリクスを示しています。
3. ダッシュボードのインサイトをすばやく把握
ダッシュボードはオブザーバビリティの重要な部分であり、システムのパフォーマンス、使用傾向、健全性メトリクスに対するインサイトを視覚化します。ただし、複数のグラフを組み合わせた複雑なダッシュボードを扱っていて、それらのデータに慣れておらず簡単な概要が必要な場合には、どこに注力すべきかが分かりにくいことがあります。New Relic AIは、ダッシュボードをわかりやすい言葉で要約して、この問題を解決します。チャートを切り替えたり、パターンを探したりするのではなく、ダッシュボードに表示されている内容を尋ねるだけで、New Relic AIが最も関連性の高いインサイトの簡潔な概要を提供します。
新しいサービスを監視するよう割り当てられ、チームがすでにそのサービス用のダッシュボードを作成しているとします。すぐに把握するために、次のように尋ねることができます。
このダッシュボードに何が表示されていますか?
New Relic AIはダッシュボードを分析し、重要ポイントを提供します。以下は、New Relicのダッシュボードの概要の例です。
この概要を使用すると、個々のグラフをすべて分析しなくても、全体的なパフォーマンスを素早く把握し、傾向を特定することができます。新しいチームメンバーをオンボーディングするときや、直前のパフォーマンスミーティングの準備をするときに、この機能が特に役立ちます。これにより、グラフの解読に不必要な時間を費やすことなく、重要なことに集中できるようになります。
4. 包括的なアラートカバレッジの確保
通常、アラートは、何か問題が発生した場合のエンジニアにとっての最初の防御策です。アラートが適切にカバーされていないと、重大な問題を見落とし、機能停止やパフォーマンスの低下につながる恐れがあります。しかし、複雑なシステム内のすべてのエンティティのアラート設定を手動で検証することは、エンジニアにとって悪夢です。アラートの適用範囲を確認することよりも、実際の問題を修正したいと考えています。New Relic AIを使用すると、アラートが設定されていないエンティティ、サービス、ホスト、アプリケーションを迅速に特定できます。監視されていないサービスを特定するには、まずアシスタントにスタック内のギャップまたはスタックの特定の箇所を見つけるように依頼します。
アラートがカバーしていないAPMサービスを教えて下さい
上記のプロンプトでは、アラートがカバーされていないAPMサービスのリストが生成されます。
これらのギャップを特定したら、同じNew Relic AIアシスタント、UI、REST APIを使用してアラートを設定できます。
5. Syntheticモニタリングの簡素化
Syntheticモニタリングは、ユーザーインタラクションをシミュレートすることにより、重要なサービスが常に利用でき、期待どおりに実行されるようにします。ただし、これらのモニターを手動で設定し、各種設定、スケジュール、閾値を定義することが、不必要なボトルネックになる可能性があります。
New Relic AIでは、簡単な説明だけで済みます。たとえば、APIエンドポイントの稼働時間を追跡する必要がある場合は、次のように尋ねることができます。
Checkout Serviceのpingモニターを設定してください
New Relic AIは、pingモニターを作成するためのインタフェースで応答します。
pingを要件に合わせて設定すると、稼働時間とレスポンスタイムを即座に把握できます。メニュー画面もなく、行ったり来たりすることもありません。ニーズに合わせた結果が即座に得られます。この機能は単に便利なだけではありません。プロアクティブな監視をアクセスしやすく効率的に行い、ユーザーが問題に気づく前にサービスの回復力を維持できるようにします。
まとめ
エンジニアリングでは問題解決がすべてですが、使用するツールによって、作業の効率が大きく変わります。New Relic AIは私のオブザーバビリティへのアプローチ方法を再定義し、これまで何時間もかかっていたタスクをわずか数分で完了できるようにしました。自然言語によるNRQLクエリの作成から、ダッシュボードの把握、アラートの完全なカバレッジの確保に至るまで、New Relic AIのおかげでワークフローが簡素化され、回復力のある高性能システムの構築という真に重要なことに集中できるようになりました。
あなたがハードワークではなく、よりスマートに働く方法を探しているエンジニアなら、New Relic AIを検討する価値があります。これは単なるツールではなく、現代のオブザーバビリティに大きな変革をもたらします。
次のステップ
New Relic AIを使い始める準備はできていますか?
- ここからNew Relic AIにサインアップしてください
- 詳細なガイダンスについては、 New Relic AIのドキュメントを確認してください
- New RelicのアラートとNRQLの基本について詳しくは、こちらをご覧ください
本ブログに掲載されている見解は著者に所属するものであり、必ずしも New Relic 株式会社の公式見解であるわけではありません。また、本ブログには、外部サイトにアクセスするリンクが含まれる場合があります。それらリンク先の内容について、New Relic がいかなる保証も提供することはありません。