エージェンティックAI時代におけるChatGPTアプリのオブザーバビリティ

組み込み AI における "ブラックボックス"

AI を活用した対話型インターフェースの台頭によって、アプリケーション開発は新たなフロンティアが切り開かれました。
現在、多くのイノベーターたちは、各企業独自の専門的なサービスや機能を ChatGPT のようなプラットフォームに直接組み込んだ「ChatGPTアプリ」を構築しています。
ChatGPT アプリをモニターリングすることにより、企業は自社のサービスに AI プロンプト回答をより高品質に組み込むことができるようになるでしょう。
そしてユーザーは AI との自然な会話の中で専門的なサービスを利用できるようになります。
強力で直感的なこのツールは、まさに成長の始まりと言えるでしょう。

ただし、注意点があります。
アプリケーションに ChatGPT を組み込む際に、iframe を用いてレンダリングすると、「ブラックボックス」状態に陥ってしまいます。標準的なブラウザモニタリングツールは、このような制限された環境では機能しないことがよくあります。複雑なセキュリティヘッダー、コンテンツセキュリティポリシー (CSP)、iframe のサンドボックスルールまたはクライアントサイドストレージの制限により、パフォーマンスやユーザー体験に関する重要なデータを覆い隠してしまう可能性があります。

しかし、ご安心ください。New Relic はこの課題に正面から取り組んできました。New Relic の Browser エージェント（v1.305.0以降）を使用することで、その ChatGPT アプリの "内部" を可視化することができます。

静的テンプレートから動的アプリケーションへ

ChatGPT アプリをデプロイすることは、単に ChatGPT スレッド内に静的なウェブページを表示させるだけということではありません。
動的なコンテンツエンジンをアプリケーションに組み込んでいるのです。
モデルが生成したデータが構造化されたテンプレートにそって表示されることで、リアルタイムのコンテンツ生成、パーソナライズされた製品比較や複雑な財務予測を即座に生成する、生きたページに変わります。また、それらは ChatGPT インターフェース上でのユーザーの入力によって行われます。

しかし、「事前レンダリング」から「AIレンダリング」への変化は、新たな種類の表示に関する課題をもたらします。
AI によるレンダリングは、アルゴリズムによってコンテンツが生成されるため、"実際の環境" (ユーザー側の環境) でどのように表示されるかを完全に予測することが極めて困難です。見た目は正しいものの機能的には正しくない "ハルシネーションを起こした" UI 要素、生成テキストが本来の CSS に従わず、レイアウト破壊をしてしまう問題やバックエンドが実際には提供していないデータを AI が参照してしまう「ゴーストサイテーション」といった問題が発生する可能性があります。十分なオブザーバビリティがなければ、こうしたプログラム上の不整合は開発者から見えないままとなり、AI がビジネスにふさわしいコンテンツを提供しているのか、それとも単にエラーを伴うハルシネーションを生み出しているだけなのか、判断できなくなってしまいます。

ロバストなテレメトリーデータによってギャップを解消

1. リアルタイム接続

PageViews、PageViewTimings、AjaxRequests を取得することで、GPT iframe 内のアプリケーションのレイテンシと接続状況に関する洞察を即座に把握できます。LLM がトリガーしてから専用 UI が読み込まれるまでの時間を正確に確認できます。

2. 防御的なエラー検知

JavaScript エラー検知は第一線の防御機能を提供し、動的な AI 応答がユーザーのブラウザでスクリプトや構文エラーを引き起こした場合にアラートを発します。さらに、ログ検知によってコンソールに送信された項目をキャッチできるため、ホスト環境の制約で他のデバッグ手法が使えない場合でも、詳細かつリアルタイムなメッセージングが可能になります。

3. AIロジック向けカスタム分析

UserAction イベントは、ユーザーが AI 生成コンテンツをどのように操作したか（「カートに追加」をクリックしたか、レコメンデーションを無視したかなど）を自動的に追跡します。これを PageActions や Custom Events と組み合わせることで、特定の AI 関連ベンチマークを追跡するダッシュボードを構築できます。

AI レンダリング成功率：LLM が仕様に従ってグラフや表を正しく生成できた頻度
プロンプトからアクションへのコンバージョン率：特定のタイプの AI のサジェスチョンが、ユーザーエンゲージメントの向上につながっているか？

New Relic の Browser エージェントをChatGPT アプリに統合して、重要な洞察と戦略的優位性を獲得する：

ユーザーの不満を検出：レイジクリック、エラークリック、デッドクリックを検知することで、アプリケーションがエンドユーザーにストレスを与えているタイミングを特定することができます
レイアウトの不安定性をモニタリング：AI がコンテンツをストリーミングする際、iframe 内の累積レイアウトシフト (Cumulative Layout Shift (CLS)) を追跡します。これはストレスの溜まるユーザー体験の原因となります
クロスオリジンに関する洞察：アプリケーションがトップレベルのウィンドウを所有していない場合の動作を詳細に把握し、異なるホスト環境への最適化を支援します
エンドツーエンドのトレーサビリティ：ChatGPT の iframe 内でのユーザー操作からバックエンドサービスまでを一貫してつなげて、すべてのトランザクションの全体像を提供します

可視化を実現する 3つのステップ

ChatGPT アプリの可視化は、簡単に開始できます。

最新の Browser エージェントをインストールする：ChatGPT インテグレーションは v1.305.0 以降でサポートされています。このバージョンには、ChatGPT の埋め込み iframe 特有のセキュリティと実行環境を適切に処理するための機能強化が含まれています。
"価値ある" アクションを定義する：GPT からアプリへのハンドオフの成功を補足するためのカスタムインタラクション、属性、"キートランザクション" を設定します。これにより "コネクター成功率" を追跡でき、最も重要なユーザージャーニーに注力することができます。
New Relic プラットフォームでデータをモニタリングする：すぐに使えるエクスペリエンスとカスタムダッシュボードで、すべてのデータを可視化し、アプリケーションのパフォーマンスを把握するまでの時間を短縮します。

アプリケーションが他のアプリ内で動作する「エージェンティック AI」の時代は、始まったばかりです。各種サービスがさまざまな AI プラットフォームに統合されるにつれて、それらのプラットフォーム内でのパフォーマンス、信頼性、ユーザー体験をモニタリングする機能は、もはや贅沢品ではなく、必須となっています。

New Relic の強化された Browserエージェントは、この新しい環境で成功するために不可欠なオブザーバビリティを提供します。革新的な AI インテグレーションを "ブラックボックス" のままにしないでください。強力な可視性を手に入れ、よりスマートにデバッグを行い、ユーザーがアプリケーションをどこでどのように利用しても、常にシームレスな体験ができるようにしましょう。

By Jordan Porter, New Relicのリードソフトウェアエンジニア

本ブログに掲載されている見解は著者に所属するものであり、必ずしも New Relic 株式会社の公式見解であるわけではありません。また、本ブログには、外部サイトにアクセスするリンクが含まれる場合があります。それらリンク先の内容について、New Relic がいかなる保証も提供することはありません。

780+ インテグレーションを導入し、スタック監視を無料で開始しましょう

詳細を見る

この記事の内容

エージェンティック AI 時代における ChatGPT アプリのオブザーバビリティ

組み込み AI における "ブラックボックス"