組み込み AI における "ブラックボックス"

AI を活用した対話型インターフェースの台頭によって、アプリケーション開発は新たなフロンティアが切り開かれました。
現在、多くのイノベーターたちは、各企業独自の専門的なサービスや機能を ChatGPT のようなプラットフォームに直接組み込んだ「ChatGPTアプリ」を構築しています。
ChatGPT アプリをモニターリングすることにより、企業は自社のサービスに AI プロンプト回答をより高品質に組み込むことができるようになるでしょう。
そしてユーザーは AI との自然な会話の中で専門的なサービスを利用できるようになります。
強力で直感的なこのツールは、まさに成長の始まりと言えるでしょう。

ただし、注意点があります。
アプリケーションに ChatGPT を組み込む際に、iframe を用いてレンダリングすると、「ブラックボックス」状態に陥ってしまいます。標準的なブラウザモニタリングツールは、このような制限された環境では機能しないことがよくあります。複雑なセキュリティヘッダー、コンテンツセキュリティポリシー (CSP)、iframe のサンドボックスルール または クライアントサイドストレージの制限により、パフォーマンスやユーザー体験に関する重要なデータを覆い隠してしまう可能性があります。

しかし、ご安心ください。New Relic はこの課題に正面から取り組んできました。New Relic の Browser エージェント(v1.305.0以降)を使用することで、その ChatGPT アプリの "内部" を可視化することができます。

静的テンプレートから動的アプリケーションへ

ChatGPT アプリをデプロイすることは、単に ChatGPT スレッド内に静的なウェブページを表示させるだけということではありません。
動的なコンテンツエンジンをアプリケーションに組み込んでいるのです。
モデルが生成したデータが構造化されたテンプレートにそって表示されることで、リアルタイムのコンテンツ生成、パーソナライズされた製品比較や複雑な財務予測を即座に生成する、生きたページに変わります。また、それらは ChatGPT インターフェース上でのユーザーの入力によって行われます。

しかし、「事前レンダリング」から「AIレンダリング」への変化は、新たな種類の表示に関する課題をもたらします。
AI によるレンダリングは、アルゴリズムによってコンテンツが生成されるため、"実際の環境" (ユーザー側の環境) でどのように表示されるか を完全に予測することが極めて困難です。見た目は正しいものの機能的には正しくない "ハルシネーションを起こした" UI 要素、生成テキストが本来の CSS に従わず、レイアウト破壊をしてしまう問題 やバックエンドが実際には提供していないデータを AI が参照してしまう「ゴーストサイテーション」といった問題が発生する可能性があります。十分なオブザーバビリティがなければ、こうしたプログラム上の不整合は開発者から見えないままとなり、AI がビジネスにふさわしいコンテンツを提供しているのか、それとも単にエラーを伴うハルシネーションを生み出しているだけなのか、判断できなくなってしまいます。

ロバストなテレメトリーデータによってギャップを解消

1. リアルタイム接続

PageViews、PageViewTimings、AjaxRequests を取得することで、GPT iframe 内のアプリケーションのレイテンシと接続状況に関する洞察を即座に把握できます。LLM がトリガーしてから 専用 UI が読み込まれるまでの時間を正確に確認できます。

2. 防御的なエラー検知

JavaScript エラー検知は第一線の防御機能を提供し、動的な AI 応答がユーザーのブラウザでスクリプトや構文エラーを引き起こした場合にアラートを発します。さらに、ログ検知によってコンソールに送信された項目をキャッチできるため、ホスト環境の制約で他のデバッグ手法が使えない場合でも、詳細かつリアルタイムなメッセージングが可能になります。

3. AIロジック向けカスタム分析

UserAction イベントは、ユーザーが AI 生成コンテンツをどのように操作したか(「カートに追加」をクリックしたか、レコメンデーションを無視したかなど)を自動的に追跡します。これを PageActions や Custom Events と組み合わせることで、特定の AI 関連ベンチマークを追跡するダッシュボードを構築できます。

  • AI レンダリング成功率:LLM が仕様に従ってグラフや表を正しく生成できた頻度
  • プロンプトからアクションへのコンバージョン率:特定のタイプの AI のサジェスチョンが、ユーザーエンゲージメントの向上につながっているか?

New Relic の Browser エージェントをChatGPT アプリに統合して、重要な洞察と戦略的優位性を獲得する:

  • ユーザーの不満を検出:レイジクリック、エラークリック、デッドクリックを検知することで、アプリケーションがエンドユーザーにストレスを与えているタイミングを特定することができます
  • レイアウトの不安定性をモニタリング:AI がコンテンツをストリーミングする際、iframe 内の 累積レイアウトシフト (Cumulative Layout Shift (CLS)) を追跡します。これはストレスの溜まるユーザー体験の原因となります
  • クロスオリジンに関する洞察:アプリケーションがトップレベルのウィンドウを所有していない場合の動作を詳細に把握し、異なるホスト環境への最適化を支援します
  • エンドツーエンドのトレーサビリティ:ChatGPT の iframe 内でのユーザー操作からバックエンドサービスまでを一貫してつなげて、すべてのトランザクションの全体像を提供します

可視化を実現する 3つのステップ

ChatGPT アプリの 可視化は、簡単に開始できます。

  1. 最新の Browser エージェントをインストールするChatGPT インテグレーションは v1.305.0 以降でサポートされています。このバージョンには、ChatGPT の埋め込み iframe 特有のセキュリティと実行環境を適切に処理するための機能強化が含まれています。
  2. "価値ある" アクションを定義する:GPT からアプリへのハンドオフの成功を補足するためのカスタムインタラクション、属性、"キートランザクション" を設定します。これにより "コネクター成功率" を追跡でき、最も重要なユーザージャーニーに注力することができます。
  3. New Relic プラットフォームでデータをモニタリングするすぐに使えるエクスペリエンスとカスタムダッシュボードで、すべてのデータを可視化し、アプリケーションのパフォーマンスを把握するまでの時間を短縮します。

アプリケーションが他のアプリ内で動作する「エージェンティック AI」の時代は、始まったばかりです。各種サービスがさまざまな AI プラットフォームに統合されるにつれて、それらのプラットフォーム内でのパフォーマンス、信頼性、ユーザー体験をモニタリングする機能は、もはや贅沢品ではなく、必須となっています。

New Relic の強化された Browserエージェントは、この新しい環境で成功するために不可欠なオブザーバビリティを提供します。革新的な AI インテグレーションを "ブラックボックス" のままにしないでください。強力な可視性を手に入れ、よりスマートにデバッグを行い、ユーザーがアプリケーションをどこでどのように利用しても、常にシームレスな体験ができるようにしましょう。