BLOG | BUREAU DU CTO

L'observabilité à l'heure des agents IA

Miniature de Lori MacVittie
Lori MacVittie
Publié le 13 août 2025

Les agents d’IA sont présents, et ils ne se contentent pas d’appeler des API ou de diffuser du contenu. Ils réfléchissent. Ils prennent des décisions. Ils planifient et délèguent. Ils agissent à travers votre infrastructure, vos services et votre plateforme de gestion du trafic.

Le problème ? La plupart de nos systèmes ignorent totalement leurs actions.

L’observabilité traditionnelle suivait les services. Vous savez, les éléments concrets : requêtes, réponses, latences, chemins. Elle n’a jamais cherché à expliquer pourquoi une requête avait lieu, seulement à confirmer qu’elle avait eu lieu. Aujourd’hui, votre trafic peut provenir d’une boucle de raisonnement récursive au sein d’un agent, et vos logs ne montreront qu’un POST vers/recherche avec une charge utile et un 200.

Ce n’est pas de l’observabilité. C’est de l’opacité.

Pour déployer en toute sécurité des agents d’IA, notamment en environnements de production, vous devez intégrer les systèmes de gestion du trafic dans votre stratégie.  

Mais d'abord, il faut que l'observabilité évolue. Cela commence par trois lacunes majeures.

1. Consignez les décisions, pas uniquement les requêtes

Les agents ne se contentent pas de réagir. Ils prennent des décisions. Ils évaluent. Ils différent, redirigent, escaladent ou sollicitent des outils. Si vous ne consignez que la couche HTTP, vous passez à côté de l’essentiel, c’est-à-dire pourquoi cela s’est produit.

Vous devez disposer de journaux structurés qui reflètent l’intention de l’agent, l’action choisie, les alternatives évaluées et leur résultat. Vous avez besoin de chemins de décision. Pas uniquement des codes d’état.

Que faire :

  • Étendez les formats de journalisation pour intégrer des champs sémantiques comme l'intention, l'action réalisée, le degré de confiance et la contrainte de politique.
  • Identifiez les décisions selon l'agent d'origine et suivez-les de bout en bout à travers les appels d'outils.

2. Surveillance de la sémantique, pas uniquement des chemins

Deux POST vers un même point de terminaison peuvent correspondre à des actions très différentes lorsqu’ils proviennent d’agents IA. L’un peut être une demande de vérification des faits, tandis que l’autre déclenche la création de contenu. Le chemin est identique, mais l’objectif, le contexte et le risque varient.

Cela signifie que le marquage sémantique doit jouer un rôle central dans le routage et l’observabilité.

Que faire :

  • Utilisez l'inspection en ligne (charges utiles ou en-têtes) pour extraire des balises d'intention comme résumer, vérifier_identité ou générer.
  • Utilisez ces balises pour orienter le routage des requêtes, la limitation de débit et les décisions d’authentification. Ne traitez pas tous les POST de façon identique.

3. Analysez le comportement sur le long terme

Les agents ne se comportent pas comme des clients sans état. Ils évoluent. Ils recommencent. Ils bloquent. Ils s’adaptent. Vous devez donc dépasser les traces de requêtes isolées pour construire des profils de comportement solides.

Vous devez comprendre ce que « normal » représente pour un agent : ses nombres de tentatives, ses outils, la durée de ses tâches. Et lorsque cela évolue ? Vous devez le savoir aussi.

Que faire :

  • Surveillez les metrics de suivi pour chaque identité d'agent : les nouvelles tentatives, la profondeur des tâches et l'usage des outils.
  • Alerte en cas d'anomalies : boucles, dérive de latence, surcharge d'outils.

Enjeux pour la gestion du trafic

Cela a de véritables conséquences sur les systèmes en lesquels vous pouvez avoir confiance pour diriger, sécuriser et faire évoluer vos applications :

Modèle actuel Modèle à venir
Journal des requêtes Journaux de décision
Routage en fonction du chemin Routage orienté intention
Limitation du taux utilisateur/IP Limites liées aux classes d'intentions et profils d'agents
Traces Arbres de tâches avec balises sémantiques

 

Les agents IA ne sont pas des utilisateurs. Ils ne sont pas clients. Ils ne sont même pas des services au sens traditionnel. Ce sont des flux de travail autonomes. Tant que vous ne les traiterez pas ainsi — en commençant par l’observabilité — vous resterez dans le flou.

Votre trafic ne se limite plus au simple trafic. Votre infrastructure ne doit plus non plus le considérer comme tel.

Commencez à enregistrer comme si un agent surveillait. Parce que c’est probablement le cas.