BLOG | OFICINA DEL CTO

Agentes de IA que trasladan la toma de decisiones a niveles superiores

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 10 de julio de 2025

¿Has tenido ese momento en que te das cuenta de que la arquitectura que llevas perfeccionando una década está a punto de ser reemplazada por algo que ni siquiera existía en tu radar hace dos años?

Bienvenido a la era de las arquitecturas de agentes.

Estos no son simples scripts de automatización ni envoltorios de inteligencia artificial. Los agentes se guían por objetivos, generan ideas y cada vez toman más la iniciativa por sí mismos. No se limitan a usar APIs; crean su propia ruta a través de ellas. ¿Lo mejor? Incorporan su propia aplicación de políticas.

Cada solicitud que envía un agente puede incluir:

  • Encabezados de intención (X-Goal, X-Context, X-Route-Preference)
  • Instrucciones alternativas según la sensibilidad real del SLA
  • Un recuerdo de lo que no funcionó antes
  • Indicaciones sobre cómo se define el éxito (aviso: no es “200 OK”)
  • Esto es tomar decisiones en tiempo real. No dependemos de una orquestación centralizada ni predefinida. Delegamos en la ejecución y eso transformará el funcionamiento de la infraestructura.

    Por qué importa (antes de lo que imaginas)

    Por ahora, la mayoría de los sistemas empresariales no experimentan dificultades. Los agentes iniciales siguen siendo chatbots, copilotos o herramientas de productividad aisladas.

    Pero cuando pasan a formar parte de los flujos de trabajo empresariales (como la resolución de pedidos, el procesamiento de reclamaciones, la triaje o la gestión de entregas), comienzan a interactuar con sistemas reales. Esto implica:

    • La infraestructura debe interpretar la lógica que llevan los agentes
    • Los gateways deben analizar más que solo JWT y rutas
    • Los balanceadores de carga deben dejar de buscar ser los más rápidos y enfocarse en ser los más adecuados para cada tarea

    Aún no es una crisis. Pero está por llegar. Cuando llegue, el problema no será la falta de ancho de banda. Será la desconexión entre cómo los agentes toman decisiones y cómo la infraestructura gestiona el tráfico.

    La transformación: De la aplicación al cumplimiento

    La verdadera clave arquitectónica es que los agentes están trasladando la toma de decisiones a niveles superiores.

    La solicitud pasa a formar parte del plano de control.

    No pregunta a la infraestructura: “¿Qué debo hacer?” Le indica: “Esto es lo que necesito. Así quiero que actúes. Ahora, hazlo.”

    Si tus sistemas lo tratan como una solicitud normal, otro GET o POST más, la lógica de recuperación entrará en conflicto, los reintentos se solaparán y el rendimiento del agente se verá afectado por causas que no aparecerán en tus paneles.

    No porque la infraestructura falló. Sino porque no prestó atención.

    El origen de esto

    Este cambio no es solo teórico, está surgiendo gracias a marcos reales. Iniciativas como el Protocolo de Contexto de Modelo (MCP), los modelos de comunicación de Agente a Agente (A2A) e incluso los primeros trabajos en enrutamiento de tareas basados en políticas, apuntan todas hacia la misma dirección:

    • MCP incorpora el contexto completo—objetivos, limitaciones y opciones alternativas—directamente en el payload de la solicitud.
    • Los protocolos A2A permiten a los agentes coordinar tareas y delegar decisiones dinámicamente, sin un orquestador central.
    • La delegación de tareas en tiempo de ejecución mediante metadatos estructurados permite que la infraestructura interprete, sin tomar decisiones, en el momento de la ejecución.

    Se diferencian en sintaxis, estructura y nivel de abstracción, pero todos llegan al mismo resultado arquitectónico: política en el payload y propósito en la solicitud.

    Una vez que la solicitud asume la lógica, la infraestructura enfrenta dos caminos: adaptarse o limitarse a ser un conducto que solo transporta payloads.

    Qué puedes hacer ahora (antes de que surja un problema)

    No se trata de desmontar y sustituir. Se trata de anticiparte al cambio cuando aún estás a tiempo. Comienza aquí:

    1. Captura contexto
      Registra X-Intent, X-Task-Profile y cualquier otro metadato que pueda revelar qué quiere lograr el agente. Si tu capacidad de observación se limita a la URI, ya vas con retraso.
    2. Piensa en “aptitud para la tarea”, no solo en “disponibilidad”
      Que un backend esté activo no garantiza que funcione bien. Empieza a probar modelos de salud que consideren SLA, umbrales de latencia e intención.
    3. Haz que tus políticas sean inteligentes
      Las plataformas existentes de entrega y seguridad de aplicaciones cuentan con capas de scripting. Úsalas. Comienza a interpretar los encabezados de intención. Modifica las reglas de enrutamiento según los objetivos de la solicitud, no solo por la ruta del servicio.
    4. Planifica una aplicación adaptable
      En lugar de definir una lógica de respaldo en un archivo de configuración estático, empieza a explorar cómo la infraestructura puede aplicar instrucciones de respaldo incluidas en la propia solicitud.
    5. Cree un ciclo de retroalimentación
      Si los agentes redirigen el tráfico según el rendimiento anterior, queremos que formes parte de ese ciclo. Incorpora el contexto de los resultados a tus sistemas de tráfico y estado.

    Última reflexión: No te reemplazamos, te reposicionamos

    En una arquitectura dirigida por agentes, la infraestructura no desaparece. Pero sí asume un nuevo rol. Pasa de tomar decisiones a ejecutarlas con inteligencia.

    Si realizas ese cambio cuanto antes, estarás preparado para cuando llegue la ola. Porque llegará.

    Antes de lo que la mayoría espera.