BLOG | ESCRITÓRIO DO DIRETOR DE TECNOLOGIA

Observabilidade na era dos agentes de IA

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 13 de agosto de 2025

Os agentes de IA chegaram, e vão além de apenas acessar APIs ou distribuir conteúdo. Eles pensam. Eles tomam decisões. Eles planejam e delegam tarefas. E fazem isso em toda sua infraestrutura, seus serviços e sua arquitetura de gerenciamento de tráfego.

Qual é o problema? A maioria de nossos sistemas não sabe o que está fazendo.

A observabilidade tradicional foi projetada para acompanhar serviços. Você sabe, coisas concretas: solicitações, respostas, latências, caminhos. Ela não foi feita para explicar por que uma solicitação ocorreu — apenas que ocorreu. Mas agora seu tráfego pode vir de um ciclo recursivo de raciocínio dentro de um agente, e tudo que verá nos seus logs é um POST para/search com uma carga e código 200.

Isso não é observabilidade. Isso é falta de transparência.

Para operacionalizar agentes de IA com segurança, principalmente em ambientes de produção, integramos sistemas de gerenciamento de tráfego como parte fundamental da sua estratégia.  

Mas, antes, precisamos avançar na observabilidade. Tudo começa com três lacunas críticas.

1. Registre as decisões, não só as solicitações

Agentes não apenas respondem. Eles tomam decisões. Eles avaliam. Eles adiam, redirecionam, escalam ou acionam ferramentas. Se você registra só a camada HTTP, perde o que realmente importa: por que aquilo ocorreu.

Você precisa de registros estruturados que revelem a intenção do agente, a ação escolhida, as alternativas consideradas e o resultado. Você precisa dos caminhos decisórios. Não só códigos de status.

O que fazer:

  • Amplie os formatos de log para incluir campos semânticos como intenção, ação realizada, índice de confiança, e restrição de política.
  • Identifique as decisões pela origem do agente e acompanhe-as completamente através das chamadas entre ferramentas.

2. Acompanhe a semântica, não apenas o caminho

Dois POSTs para o mesmo endpoint podem indicar coisas bastante diferentes quando enviados por agentes de IA. Um pode ser uma solicitação para checar fatos, o outro, o acionamento de geração de conteúdo. O caminho é o mesmo, mas o propósito, o contexto e o risco são distintos.

Isso significa que a marcação semântica precisa se tornar fundamental no solicitar roteamento e na observabilidade.

O que fazer:

  • Use inspeção inline (payloads ou cabeçalhos) para extrair tags de intenção como summarize, verify_identity ou generate.
  • Utilize essas tags para orientar solicitações de roteamento, controle de taxa e decisões de autenticação. Trate os POSTs de forma diferenciada.

3. Acompanhe o comportamento ao longo do tempo

Agentes não agem como clientes sem estado. Eles evoluem. Eles tentam de novo. Eles travam. Eles se adaptam. Por isso, sistemas de observabilidade precisam ir além dos rastros de uma única solicitação e começar a construir perfis de comportamento.

Você precisa reconhecer o que significa "normal" para um agente: quantas tentativas ele realiza, quais ferramentas utiliza e quanto tempo ele leva para executar suas tarefas. E quando isso mudar? Você também deve perceber.

O que fazer:

  • Monitore métricas constantes para cada identidade de agente: tentativas, complexidade da tarefa, uso das ferramentas.
  • Alerta sobre anomalias: loops, variações de latência, instabilidade de ferramentas.

O que isso representa para o gerenciamento de tráfego

Tudo isso impacta diretamente os sistemas nos quais confiamos para conduzir, proteger e escalar nossas aplicações:

Modelo atual Modelo Futuro
Solicitar registros Registros de decisões
Roteamento pelo caminho Roteamento orientado por intenção
Limitação de taxa por usuário/IP Limites da classe de intenção e do perfil do agente
Traços de rastreamento Árvores de tarefas com tags semânticas

 

Agentes de IA não são usuários. Eles não são clientes. Nem mesmo são serviços no sentido tradicional. São fluxos de trabalho autônomos. Enquanto não os tratarmos assim — começando pela observabilidade — continuaremos operando no escuro.

Então não, seu tráfego não é mais só tráfego. E sua infraestrutura não deve se comportar como tal.

Comece a registrar como se um agente estivesse acompanhando. Porque provavelmente está.