BLOG | ESCRITÓRIO DO DIRETOR DE TECNOLOGIA

Agentes de IA elevando a tomada de decisões na pilha

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 10 de julho de 2025

Você sabe quando percebe que a arquitetura que vem aperfeiçoando há uma década está prestes a ser destruída por algo que nem estava no radar dois anos atrás?

Bem-vindo à era das arquiteturas baseadas em agentes.

Não são scripts de automação comuns nem simples invólucros de IA. Os agentes agem com foco em objetivos, geram soluções e são cada vez mais autônomos. Eles não apenas invocam APIs; eles navegam por elas de forma proativa. E o diferencial? Eles trazem suas próprias políticas.

Cada solicitação feita por um agente pode conter:

  • Cabeçalhos de intenção (X-Goal, X-Context, X-Route-Preference)
  • Instruções de recuperação baseadas na sensibilidade do SLA no mundo real
  • Uma recordação do que não deu certo da última vez
  • Indícios do que sucesso realmente significa (spoiler: não é o “200 OK”)
  • Esta é a tomada de decisão em ação. Não se trata de uma orquestração centralizada e pré-planejada. Delegamos em tempo real, e isso vai transformar a forma como a infraestrutura funciona.

    Por que isso importa (mais cedo do que você espera)

    Neste momento, a maioria dos sistemas empresariais não enfrenta dificuldades. Os primeiros agentes continuam sendo chatbots, copilotos ou ferramentas de produtividade isoladas.

    À medida que avançam para os fluxos de trabalho empresariais (como resolução de pedidos, processamento de sinistros, triagem, entrega), eles começam a interagir com sistemas reais. Isso significa:

    • A infraestrutura precisa entender a lógica inserida pelo agente
    • Gateways precisam interpretar mais do que apenas JWTs e caminhos
    • Balanceadores de carga devem deixar de focar no “mais rápido” e passar a focar no “adequado para a tarefa”

    Ainda não é uma crise. Mas está prestes a chegar. Quando acontecer, o problema não será a falta de largura de banda. Será o desencontro entre as decisões dos agentes e o modo como a infraestrutura gerencia o tráfego.

    A mudança: Da aplicação à execução

    Aqui está o verdadeiro ponto da arquitetura: os agentes estão elevando a tomada de decisões na pilha.

    A solicitação assume o papel do plano de controle.

    Ele não pergunta à infraestrutura: "O que devo fazer?" Ele a orienta: "Preciso disto. Quero que você aja assim. Agora execute."

    Se seus sistemas tratarem isso como uma solicitação normal, apenas mais um GET ou POST, a lógica de fallback vai conflitar, as tentativas vão se sobrepor e o desempenho do agente vai cair por razões que não aparecerão nos seus painéis.

    Não porque a infraestrutura falhou. Mas porque não prestamos atenção.

    A origem disso

    Essa transformação não é apenas teórica, está se concretizando em estruturas reais. Iniciativas como o Model Context Protocol (MCP), modelos de comunicação Agente-a-Agente (A2A) e até os primeiros avanços em roteamento de tarefas com políticas indicam a mesma direção:

    • MCP incorpora o contexto completo — objetivos, restrições, opções de fallback — diretamente na carga da solicitação.
    • Os protocolos A2A permitem que você coordene tarefas e transfira decisões dinamicamente entre agentes, sem depender de um orquestrador central.
    • A delegação de tarefas em tempo de execução por metadados estruturados permite que a infraestrutura interprete — sem decidir — no momento da execução.

    Eles diferem em sintaxe, estrutura e abstração — mas todos alcançam o mesmo resultado arquitetônico: política na carga mal-intencionada e finalidade na solicitação.

    E quando a solicitação carregar a lógica, a infraestrutura terá duas opções: se adaptar ou se reduzir a um simples pipeline de transporte de cargas.

    O que você pode fazer agora (antes que vire um problema)

    Não é uma questão de demolir e substituir. É uma oportunidade de se antecipar à mudança, enquanto ainda está no início. Comece por aqui:

    1. Capture o contexto
      Registre X-Intent, X-Task-Profile e todos os metadados que indiquem o que o agente tenta realizar. Se sua observabilidade parar no URI, você já estará atrasado.
    2. Pense em “adequação à tarefa”, não em “disponibilidade”
      Um backend funcionando não garante sua eficácia. Comece a testar modelos de saúde que considerem SLA, limites de latência e intenção.
    3. Seja estratégico com suas políticas
      Plataformas existentes de entrega e segurança de aplicações já contam com camadas de script. Aproveite-as. Comece a interpretar os cabeçalhos de intenção. Ajuste regras de roteamento com base nos objetivos da solicitação, não apenas no caminho do serviço.
    4. Planeje a aplicação adaptativa
      Em vez de definir a lógica de fallback em um arquivo de configuração estático, comece a explorar como a infraestrutura pode aplicar as instruções de fallback incorporadas na própria requisição.
    5. Crie um ciclo de feedback
      Se os agentes redirecionam o tráfego com base no desempenho anterior, você precisa fazer parte desse ciclo. Reintroduza o contexto dos resultados nos seus sistemas de tráfego e monitoramento.

    Reflexão final: Você não está sendo substituído, está sendo reposicionado

    Em uma arquitetura orientada a agentes, a infraestrutura não desaparece. Ela apenas muda de papel. Para de tomar decisões e assume a execução, com inteligência.

    Se você conseguir antecipar essa mudança, estará pronto para esse movimento quando ele chegar. E ele está chegando.

    Antes do que a maioria imagina.