ブログ | CTO オフィス

AIエージェントの時代における観測性

ロリ・マクヴィッティ サムネイル
ロリ・マクヴィッティ
2025年8月13日 発行

AIエージェントはもうAPIを呼ぶだけやコンテンツを配信するだけではありません。 彼らは考えています。 判断しています。 計画し、役割を任せています。 そのすべてをあなたのインフラストラクチャ、サービス、トラフィック管理スタックで実行しているのです。

問題ですか? 多くのシステムが自分の役割を理解していません。

従来の可観測性はサービスの追跡を目的としていました。 具体的には、リクエスト、レスポンス、遅延、ルートです。 リクエストがなぜ発生したかを理解するためでなく、発生した事実だけを記録していました。 しかし今では、トラフィックがエージェント内の再帰的な推論ループから発生しているかもしれません。その場合、ログに表示されるのはペイロード付きの/searchへのPOSTとステータス200だけです。

それは観測性ではありません。 それは不透明さです。

AIエージェントを安全に運用し、特に本番環境で活用するなら、トラフィック管理システムを戦略の中心に据えましょう。  

まず、観測可能性を高める必要があります。 それは3つの重要なギャップから始まります。

1. リクエストだけでなく、判断も記録しましょう

エージェントはただ応答するだけではありません。 彼らが決める。 彼らは評価します。 延期、再ルーティング、エスカレーション、またはツールの呼び出しを行います。 また、HTTP レイヤーのみをログに記録する場合、実際に重要な部分が欠落しており、これが問題が発生する原因です。

エージェントの意図、選択した行動、検討した代替案、そして結果を正確に捉える構造化ログが必要です。 決定の過程を追うデータも求められます。 単なるステータスコードだけでは足りません。

すべきこと:

  • ログ形式を拡張して、意図、実施した行動、信頼度スコア、およびポリシー制約などのセマンティックフィールドを追加します。
  • 発信元エージェントごとに決定をタグ付けし、ツール間の処理をエンドツーエンドで追跡しましょう。

2. パスだけでなく意味も追跡しましょう

AIエージェントから送られる同じエンドポイントへの2つのPOSTは、まったく異なる意味を持つことがあります。 片方は事実確認のリクエスト、もう片方はコンテンツ生成のトリガーかもしれません。 パスは同じでも、目的や文脈、リスクは異なります。

つまり、セマンティックタグ付けはリクエストルーティングと可観測性で不可欠な要素となるべきです。

すべきこと:

  • インライン検査(ペイロードやヘッダー)を使って、summarize、verify_identity、generate などの意図タグを抽出しましょう。
  • それらのタグをリクエストルーティング、レート制限、認証の判断に活用してください。 すべてのPOSTリクエストを同じように扱わないでください。

3. 時間をかけて行動を監視する

エージェントはステートレスクライアントのようには動きません。 状況に応じて変化します。 何度も挑戦します。 動きが止まることもあります。 その時々で適応します。 ですから、可観測性システムは単一リクエストのトレースを超え、行動パターンを構築しなければなりません。

エージェントの「正常」の状態を把握していますか?再試行回数、使用するツール、タスクの所要時間などがそれにあたります。 そして、その状態が変わったときは? それも把握しておくべきです。

すべきこと:

  • 各エージェントIDごとに、再試行回数、タスクの深さ、ツールの利用状況を継続的に追跡しましょう。
  • 異常を検知し通知します:ループ、遅延のずれ、ツールの過剰稼働。

ネットワーク トラフィック管理における意義

これらすべては、私たちが信頼してアプリケーションを操作・保護・拡張するためのシステムに直接的な影響を与えます。

現行モデル 将来の導入モデル
リクエスト ログ 意思決定ログ
パスに基づくルーティング インテントベースのルーティング
ユーザー/IPによるレート制限 インテントクラスとエージェントプロファイルの上限
トレーススパン 意味付けタグを使ったタスクツリー

 

AIエージェントはユーザーではありません。 クライアントでもありません。 従来の意味でのサービスでもありません。 自律的なワークフローです。 まず可観測性から始めて彼らをそう扱わなければ、私たちは見えないまま運用し続けることになるでしょう。

つまり、あなたのトラフィックはもはや単なるトラフィックではありません。 そして、あなたのインフラストラクチャもそのように振る舞うべきではありません。

まるでエージェントが見ているかのようにログを記録しましょう。 実際、そうなっていることが多いのです。