Ahmed Guetari, vicepresidente de gestión de productos para proveedores de servicios en F5, y Ash Bhalgat, director sénior de ecosistemas de redes y seguridad de IA en NVIDIA, te ofrecen juntos este artículo.
La IA está entrando en una etapa donde el rendimiento de inferencia y la seguridad determinan si cumples o no con las expectativas de los clientes. En la economía de los tokens, la infraestructura de IA ya no consiste solo en potencia de cálculo. Ahora debes orquestar, proteger y escalar las capacidades de inferencia, desde la nube hasta los data centers en el edge. Si gestionas infraestructuras de nube orientadas a IA generativa e inferencia, tienes la urgencia de optimizar la eficiencia de las GPU, ampliar la capacidad de tokens, reducir la latencia y proteger cada capa de tu infraestructura de IA.
En F5 damos respuesta a estos retos ampliando la capacidad de inferencia mediante la arquitectura de referencia NVIDIA Cloud Partner (NCP). Este plan clave marca cómo los proveedores líderes de nube de IA diseñan, construyen y gestionan una infraestructura acelerada por GPU. La arquitectura de referencia reúne tecnologías punteras de computación, redes, almacenamiento y seguridad, para que los NVIDIA Cloud Partners ofrezcan servicios de IA fiables y con alto rendimiento a gran escala.
Gracias a nuestra colaboración, ahora F5 BIG-IP te permite lograr inferencias seguras y de alto rendimiento dentro del ecosistema NVIDIA.
En F5 integramos de forma avanzada las capacidades de redes, seguridad y entrega de aplicaciones para que puedas aprovechar plataformas de inteligencia artificial inteligentes basadas en tokens junto a NVIDIA. Te ayudamos a impulsar la IA a gran escala, proporcionándote la velocidad, protección e inteligencia que exiges para liderar la nueva economía del token.
La arquitectura de referencia NCP te ofrece un marco completo para desplegar nubes de IA. Integramos la computación acelerada, las redes y el software de NVIDIA con tecnologías complementarias de los principales socios del ecosistema, para que disfrutes de soluciones de IA en la nube seguras, escalables y con alto rendimiento.
Como parte de esta arquitectura, F5 BIG-IP te ofrece gestión avanzada del tráfico, seguridad zero trust, servicios avanzados y observabilidad para cargas de trabajo de IA aceleradas por GPU, permitiéndote desplegar, escalar y proteger servicios de inferencia con total confianza.
En el mundo de los proveedores de nube de IA y las empresas, los tokens se han convertido en la verdadera moneda, evaluada por el rendimiento, la latencia total, el tiempo hasta recibir el primer token, la eficiencia energética y el coste por token. Tu éxito depende de la infraestructura que une a tus usuarios con los clústeres de GPU. Si quieres ofrecer servicios de IA de alto rendimiento, necesitas que el enrutamiento del tráfico, la protección, la observabilidad, la multitenencia y la aplicación de políticas funcionen a máxima velocidad y sin crear cuellos de botella.
La arquitectura de referencia NCP establece el modelo que sigues. Te guía para que las nubes soberanas y de IA conecten la computación, las redes, el almacenamiento, la telemetría y la seguridad de forma eficiente. NVIDIA BlueField-3 DPUs desempeñan un papel clave en el flujo de tráfico norte-sur de estas arquitecturas.
En F5 formamos parte de este ecosistema como habilitador de infraestructuras líder, integrando redes, seguridad y control inteligente con IA directamente en la estructura de referencia.
F5 ya ha logrado grandes avances al integrar la tecnología de NVIDIA. En abril de 2025, F5 anunció la disponibilidad general de F5 BIG-IP Next for Kubernetes acelerado con NVIDIA BlueField-3 DPUs. Con esta solución puedes descargar el procesamiento de red, la gestión de la seguridad y la inteligencia de tráfico a la DPU, permitiendo que las CPU se dediquen a las aplicaciones empresariales. SoftBank, un NCP que recientemente realizó pruebas de concepto (PoC) en la nube, obtuvo resultados de rendimiento excepcionales.
Además del rendimiento en bruto, las capacidades de F5 BIG-IP responden plenamente a las exigencias operativas de los NCP, como el control unificado de políticas de entrada y salida, el service mesh, la mitigación de ataques de denegación de servicio distribuido (DDoS), la aplicación de zero trust, la protección de API, el aislamiento de cargas de trabajo y la visibilidad multicliente, todo en una sola operación.
En nuestra colaboración, hemos optimizado la lógica de enrutamiento para modelos de lenguaje extenso (LLM), la gestión de tráfico basada en tokens y la gobernanza, además del soporte para Model Context Protocol (MCP), para darte mayor control e inteligencia directamente en la ruta de datos.
Al incorporar la arquitectura de referencia NCP, BIG-IP pasa a ser una pieza clave para que puedas diseñar, desplegar y gestionar nubes de IA con las máximas garantías.
Los primeros resultados de validación resultan sumamente atractivos. Si despliegas los servicios F5 BIG-IP junto con la plataforma de computación acelerada de NVIDIA, lograrás incrementar la generación de tokens en más del 30% y reducirás el tiempo hasta el primer token (TTFT) en un 60%.
Verás respuestas más extensas y adaptadas al contexto, ciclos de inferencia más ágiles y una reducción del 30% en el coste por token. Si además cuentas con más tokens por vatio, esta integración impulsa tanto el rendimiento como la eficiencia energética, dos factores clave en la nueva economía de la IA.
Si utilizas la nube, los NCP te ofrecen beneficios claros: llegas antes al valor, reduces los costes operativos y mejoras la experiencia de usuario en cada modelo que despliegas.
Estos avances demuestran mucho más que simples mejoras; marcan una transformación estructural en cómo puedes ofrecer, proteger y rentabilizar servicios con la nube de IA.
Al incluir F5 en la arquitectura de referencia NCP, vas a conseguir un mejor rendimiento, más seguridad y nuevas funcionalidades al desplegar servicios de IA, especialmente en los siguientes ámbitos clave:
1. Mejoras en el rendimiento: Diseñado para la economía de tokens: F5 BIG-IP se integra de manera fluida con GPUs, DPUs, tejidos de red y componentes de plataforma de software de NVIDIA (NVIDIA Dynamo, NVIDIA NIM) para que obtengas el máximo rendimiento en la inferencia de IA. Con nuestra solución F5, optimizas el enrutamiento de las peticiones, el balanceo de carga y la eficiencia en la inferencia, eliminas cuellos de botella y consigues más tokens por segundo en cada clúster.
En un entorno donde cada token impulsa los ingresos y la precisión del modelo, tú logras más productividad, respuestas ágiles y mejoras la rentabilidad. Cuando F5 y NVIDIA colaboramos, potenciamos al máximo la infraestructura acelerada en la economía de los tokens, para que la eficiencia y el rendimiento impulsen directamente tus resultados de negocio.
2. Seguridad reinventada para la inferencia de IA: La inferencia de IA a gran escala implica nuevas superficies de ataque, desde la exposición de datos hasta el uso indebido de los endpoints del modelo. En F5 ponemos tu seguridad en primer plano, integrando nuestra experiencia en app security y aplicación de políticas directamente en la arquitectura de referencia de NVIDIA. Así, protegemos tu entorno de GPU cloud con una seguridad multicapa, desde el núcleo hasta el edge. Incluye:
Obtienes una estructura de IA fiable donde rendimiento y protección van de la mano, lo que te permite escalar tus servicios NCP con total confianza, siempre manteniendo la seguridad y el cumplimiento.
3. Funcionalidad ampliada y control nativo de IA: Además del rendimiento y la seguridad, la colaboración entre F5 y NVIDIA aporta nuevos servicios de valor añadido que te ofrecen más control, visibilidad e inteligencia en los clústeres de GPU. Funciones como el enrutamiento LLM, la gestión granular de tokens, la observabilidad adaptativa y el direccionamiento del tráfico según el contexto te permiten optimizar en tiempo real la ubicación de las cargas de trabajo y el uso de recursos.
Con estas funcionalidades, te ofrecemos una entrega de aplicaciones de nivel empresarial en el ámbito de la IA, gestionando cada token, cada modelo y cada interacción de usuario con máxima precisión y eficiencia. Así, en F5 convertimos la complejidad en control y unimos tus aplicaciones tradicionales con el dinámico universo de la IA generativa.
Al integrar las capacidades de F5 con la arquitectura de referencia NCP, te facilitamos crear una nueva referencia, donde el rendimiento, el coste por token, la latencia, la eficiencia energética y la seguridad se convierten en elementos clave a la hora de diseñar infraestructuras de IA.
Si construyes tus nubes de IA sobre esta base, puedes escalar con mayor previsibilidad, monetizar con total transparencia y adaptarte con agilidad a la evolución de los modelos y las cargas de trabajo. Ahora tú, igual que los NCP, las empresas y las nubes soberanas, puedes apoyarte en una pila de referencia validada que aporta confianza y alto rendimiento.
F5 no solo se incorpora al ecosistema de NVIDIA. Juntos impulsamos la economía de tokens, donde cada microsegundo, vatio y token marcan la diferencia. Como socio estratégico en infraestructuras de IA seguras, de alto rendimiento y con escalabilidad económica, en F5 colaboramos con NVIDIA para que generes tokens de forma más eficiente, rápida, segura e inteligente.
Queremos colaborar contigo, junto a nuestros clientes, socios e innovadores, para crear la próxima generación de servicios de IA sin renunciar a nada. Si quieres saber más, visita nuestra página de F5 y NVIDIA.