BLOG | OFICINA DEL CTO

Observabilidad en la era de los agentes de inteligencia artificial

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 13 de agosto de 2025

Los agentes de IA ya están aquí y no solo se limitan a llamar APIs o a distribuir contenido. Piensan. Deciden. Planifican y delegan. Lo hacen en toda tu infraestructura, tus servicios y tu plataforma de gestión del tráfico.

¿El problema? La mayoría de nuestros sistemas no saben qué están haciendo.

La observabilidad tradicional se diseñó para rastrear servicios. Es decir, cosas concretas: solicitudes, respuestas, latencias, rutas. No buscaba entender por qué se generaba una solicitud, solo que había ocurrido. Pero ahora tu tráfico podría originarse en un bucle de razonamiento recursivo dentro de un agente, y en tus registros solo verás un POST a/search con un payload y un 200.

Eso no es observabilidad. Eso es falta de transparencia.

Para operacionalizar agentes de IA con seguridad, especialmente en entornos productivos, los sistemas de gestión del tráfico serán un pilar fundamental de tu estrategia.  

Pero primero, la observabilidad debe avanzar. Empieza por tres brechas clave.

1. Registra decisiones, no solo solicitudes

Los agentes no solo responden. Deciden. Evalúan. Posponen, redirigen, escalan o activan herramientas. Si solo registras la capa HTTP, estarás ignorando lo que realmente importa: por qué ocurrió.

Necesitas registros estructurados que reflejen la intención del agente, la acción que eligió, las alternativas que valoró y el resultado. Necesitas rutas de decisión. No solo códigos de estado.

Qué hacer:

  • Amplía los formatos de registro para incluir campos semánticos como intención, acción realizada, puntuación de confianza y restricción de políticas.
  • Asigne etiquetas a las decisiones del agente de origen y realice un seguimiento completo a lo largo de todas las llamadas entre herramientas.

2. Analiza la semántica, no solo las rutas

Dos POST a la misma endpoint pueden tener significados muy distintos cuando provienen de agentes de IA. Uno puede ser una petición para verificar un hecho y el otro un activador para generar contenido. La ruta es la misma, pero el propósito, el contexto y el riesgo difieren.

Esto significa que debemos darle máxima prioridad al etiquetado semántico en el enrutamiento y la observabilidad.

Qué hacer:

  • Utiliza la inspección en línea (payloads o encabezados) para extraer etiquetas de intención como resumir, verificar_identidad o generar.
  • Usa esas etiquetas para tomar decisiones sobre enrutamiento, limitación de velocidad y autenticación. No trates todas las solicitudes POST por igual.

3. Supervisa el comportamiento a lo largo del tiempo

Los agentes no actúan como clientes sin estado. Evolucionan. Vuelven a intentarlo. Se detienen. Se adaptan. Por eso, los sistemas de observabilidad deben ir más allá del seguimiento de solicitudes individuales y crear perfiles de comportamiento.

Debes comprender cómo es lo "normal" en un agente: cuántos intentos realiza, qué herramientas emplea, cuánto duran sus tareas. ¿Y cuándo eso cambia? Tú también debes saberlo.

Qué hacer:

  • Seguimos las métricas continuas de cada identidad de agente: reintentos, profundidad de tareas y uso de herramientas.
  • Alerta sobre anomalías: bucles, variaciones en la latencia, sobrecarga de herramientas.

Lo que esto representa para la gestión del tráfico

Todo esto afecta realmente a los sistemas en los que confías para gestionar, proteger y escalar tus aplicaciones:

Modelo actual Modelo futuro
Registros de solicitudes Registros de decisiones
Enrutamiento basado en la ruta Enrutamiento basado en intenciones
Limitación de velocidad por usuario/IP Límites de clase de intención y perfil de agente
Intervalos de seguimiento Árboles de tareas con etiquetas semánticas

 

Los agentes de IA no son usuarios. No son clientes. Tampoco son servicios en el sentido tradicional. Son flujos de trabajo autónomos. Y hasta que no los abordemos así, comenzando por la observabilidad, seguiremos operando a ciegas.

Así que no, tu tráfico ya no es solo tráfico. Y tu infraestructura no debería comportarse como tal.

Empieza a registrar con la atención de un agente. Porque seguro que así es.