BLOG | OFICINA DEL CTO

Clasificación y evolución de la entrega de aplicaciones

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 18 de agosto de 2025

Si has seguido algo de lo que he escrito en casi 20 años, ya sabes que la arquitectura de aplicaciones impacta profundamente en la entrega de aplicaciones. No solo importa cómo se construyen las aplicaciones; importa cómo se comportan, cómo escalan, cómo fallan y, sobre todo, cómo se desplazan por la infraestructura que hemos diseñado para entregarlas. Las arquitecturas basadas en agentes lo están transformando todo definitivamente. 

Esta evolución exigirá más que simplemente soporte para nuevos protocolos o capacidades de seguridad. Requerirá clasificación. 

La industria lleva años clasificando el tráfico, pero principalmente para detenerlo. Seguro que has usado la clasificación para bloquear bots, filtrar amenazas y aplicar políticas WAF a payloads maliciosos. Eso es lo básico. Y es donde la clasificación ha estado mayormente confinada: en la seguridad. 

La IA está transformando el tráfico y los recursos que empleamos para gestionarlo. ¿Y las arquitecturas de agentes? No solo cambian las reglas del juego; redefinen el juego por completo.

Gráfico de la evolución de la gestión de tráfico

La adopción de IA avanza más rápido que la mayoría de las tecnologías anteriores, y ya vemos agentes integrándose en las empresas.

Cada POST puede ser una solicitud, un objetivo o un agente de IA que analiza cómo interactúa con tu sistema. Puede iniciar un sistema de orquestación, activar un flujo de trabajo recursivo o saturar tu backend con un prompt de 200 tokens que se expande hasta 20,000. ¿Y la infraestructura? Sigue tratando todos los POST como si fueran iguales.

Ahí tienes el problema.

El tráfico moderno no es solo tráfico; es una tarea, un trabajo, una decisión. Y tu capacidad para clasificarlo antes de enrutarlo determina que tu aplicación siga siendo ágil, accesible y, sobre todo, segura.

1. Enrutamiento basado en conexión (legado)

Comencemos por lo conocido. El modelo tradicional de gestión del tráfico, basado en el enrutamiento en la Capa 4 (L4), sigue siendo la base de gran parte de Internet. Se basa en parámetros básicos:

  • Enrutamiento L4: Decidimos según los detalles de la capa de transporte, como direcciones IP y puertos.
  • Enrutamiento basado en rutas: Inspección limitada de rutas URL, generalmente en la capa de aplicación (Capa 7).
  • Pools homogéneas: Consideramos los servidores backend como iguales, sin diferenciar según capacidades especializadas.
  • Balanceo de carga: Repartimos las conexiones de manera equitativa entre servidores para evitar sobrecargas.

¿El problema? Este modelo apenas comprende el significado de una solicitud. Percibe el tráfico como paquetes iguales, no como tareas diversas con necesidades distintas. En un mundo con IA generativa, modelos de lenguaje grandes (LLM) integrados y frameworks basados en agentes, esta falta de percepción supone un riesgo creciente porque el tráfico ya no es uniforme.

Considera dos solicitudes HTTP POST:

  • Podrías realizar una operación CRUD simple (Crear, Leer, Actualizar, Eliminar), como actualizar un perfil de usuario.
  • Otra opción podría activar un flujo de trabajo complejo con múltiples agentes, como un ciclo de razonamiento impulsado por IA que realiza cinco llamadas a herramientas, escribe en una base de datos e inicia una tarea prolongada de resumen de texto.

Si tu infraestructura trata estas solicitudes igual y aplica las mismas reglas de enrutamiento, tiempos de espera o servidores backend, estás preparando un problema. Cuando abordas una tarea de IA que consume muchos recursos como una simple consulta a base de datos, acabas con cuellos de botella, fallos o un rendimiento afectado. El tráfico actual requiere una gestión más inteligente.

2. Enrutamiento por clasificación (actual/transitorio)

Llevamos años haciendo enrutamiento L7. Coincidimos rutas, inspeccionamos payloads, revisamos encabezados para decidir a qué grupo enviar el tráfico. Eso es enrutamiento basado en contenido. Es útil. Pero solo te indica qué contiene la solicitud, no por qué existe.

Para avanzar, necesitamos una clasificación basada en el contexto.

  • Funciona en L7+ y abarca más que la inspección de payload maliciosos.
  • Clasificamos el tráfico según su intención, complejidad y coste.
    • ¿Quieres realizar un resumen o iniciar sesión como usuario?
    • ¿Es recursivo, generado por inteligencia artificial o requiere baja latencia?
  • Los pools se distinguen por sus capacidades, no solo por su tamaño.
  • Las decisiones de enrutamiento consideran el propósito, no solo el formato.

Así es como pasamos de tratar el tráfico como “contenido para servir” a considerarlo “trabajo por procesar”. Esto permite decidir en tiempo real dónde debe ir una solicitud, cómo priorizarla y qué políticas aplicar en función del objetivo de la solicitud. Llámalo basado en intenciones. Llámalo consciente del contexto. No importa cómo lo llames, el cambio es claro: las solicitudes dejaron de ser simples transacciones. Se están convirtiendo en invocaciones. Desencadenantes. Metas vestidas de HTTP.

Todo esto se relaciona directamente con los 10 puntos principales de entrega de aplicação n.° 4 ( controles de tráfico ), n.° 5 ( dirección de tráfico ) y n.° 6 ( gestión de latencia ). Porque no puedes controlar, dirigir ni optimizar lo que no puedes contextualizar.

3. Enrutamiento basado en tareas (emergente)

Así avanzamos, especialmente con los sistemas automáticos y planificadores recursivos formando parte del entorno de producción. Ya no solo suministramos contenido. Gestionamos objetivos. Y eso lo transforma todo.

En este modelo, una sola solicitud no siempre genera una sola respuesta. Puede iniciar una serie de tareas más pequeñas. Algunas de esas tareas se ejecutan en paralelo. Otras dependen de que se complete alguna tarea previa. No solo diriges el tráfico; coordinas el trabajo.

Piensa en ello más como un flujo de trabajo que como una tubería. Gestionas una lista de pasos que juntos aseguran un resultado. Algunos pasos pueden ejecutar de inmediato; otros deben esperar su momento. Pero todo requiere coordinación, supervisión y dirección según capacidad, política y carga actual.

En ese momento, la lógica tradicional de enrutamiento comienza a fallar. Las rutas estáticas y las políticas uniformes no funcionan cuando cada solicitud puede transformarse en un proceso complejo con múltiples pasos y agentes. Necesitas un sistema que comprenda la tarea, sus requerimientos y quién o qué es el más adecuado para ejecutarla, no solo a dónde enviar el paquete.

Aquí está lo clave: no puedes lograr nada de eso sin clasificación. Si tu infraestructura no entiende qué intenta conseguir la solicitud, no podrá enrutarla de forma inteligente. No hablamos del futuro lejano, sino de una realidad que está surgiendo. La clasificación es el puente que nos lleva del enrutamiento de solicitudes a una coordinación efectiva.

Por qué importa

Seamos claros: no se trata de añadir más metadatos ni de construir una tabla de enrutamiento más compleja. Se trata de cambiar nuestra forma de entender el tráfico que ya gestionamos.

La clasificación nos permite pasar de reaccionar ante las solicitudes a entenderlas antes de enrutar, escalar o alterar algo, tratando un ciclo de agente recursivo como hacemos con la obtención de un recurso estático. 

Ya no es solo una cuestión de seguridad. No importa solo lo que contiene la solicitud en. Importa lo que la solicitud significa, qué busca hacer, su peso y qué impacta más adelante.

Por eso la clasificación no es una simple moda. Es una exigencia. Un paso imprescindible para evolucionar la gestión del tráfico y afrontar el mundo que construimos: uno donde agentes, tareas, flujos de trabajo y la orquestación en tiempo real ya no son casos aislados, sino prácticas habituales.

No puedes gestionar lo que no comprendes. La clasificación es el primer paso para entender.