F5 ayuda a proveedores de servicios y empresas a aprovechar al máximo el potencial de las implementaciones de IA con las DPU NVIDIA BlueField-3.

Ahmed Guetari

Publicado el 23 de octubre de 2024

En las últimas décadas, el mundo empresarial ha enfrentado muchos puntos de inflexión impulsados por revoluciones en la tecnología, y F5 ha estado allí para ayudar a nuestros clientes en estos momentos críticos.

Cuando las organizaciones comenzaron a embarcarse en sus transformaciones digitales, las aplicaciones se convirtieron en el corazón del negocio y F5 se aseguró de que pudieran entregarse y protegerse a escala. Más recientemente, cuando 5G prometió revolucionar el mundo empresarial con velocidades, servicios y confiabilidad sin precedentes, F5 estuvo allí para ayudar a las empresas móviles a implementar un núcleo 5G nativo de la nube a escala.

Ahora, una vez más, nos encontramos en un punto de inflexión, probablemente el más importante que ha enfrentado nuestra industria, a medida que las organizaciones buscan maneras de aprovechar el poder de la IA. A medida que los clientes implementan esta tecnología transformadora, F5 les ayuda a liberar todo el potencial de sus implementaciones de IA a gran escala.

La dificultad de lograr un rendimiento óptimo

La creciente adopción de clústeres de IA está impulsando la transformación hacia la computación acelerada. Intentar utilizar prácticas establecidas en informática, redes, seguridad y supervisión de uso general a menudo genera ineficiencias, demoras y aumento de los costos.

Los inmensos requisitos de procesamiento de datos de la IA ejercen una presión considerable sobre la infraestructura de red tradicional, lo que dificulta mantener un rendimiento óptimo. La unidad de procesamiento de datos (DPU) NVIDIA BlueField ha surgido como una solución clave. Al descargar y acelerar las tareas de seguridad y red de gran ancho de banda (como el procesamiento de paquetes, el cifrado y la compresión), las DPU BlueField-3 brindan una conectividad de red en la nube óptima. Esta optimización mejora el rendimiento general y acelera el acceso de la unidad de procesamiento gráfico (GPU) a los datos.

Los proveedores de servicios y las grandes empresas están construyendo infraestructuras de IA a gran escala o fábricas de IA , utilizando la plataforma informática acelerada de pila completa de NVIDIA para realizar entrenamiento e inferencia de modelos de IA generativos a escala. Las empresas necesitan maximizar sus inversiones en fábricas de IA, que pueden ser significativas. Sin embargo, sin la base adecuada, la infraestructura de IA puede quedar infrautilizada.

Gestión eficiente del gran tráfico dirigido a los servidores de IA.

F5 BIG-IP Next para Kubernetes implementado en DPU NVIDIA BlueField-3 está diseñado para abordar estos problemas. La solución se centra en descargar y acelerar F5 BIG-IP Next Service Proxy para Kubernetes (SPK) en las DPU BlueField-3 de NVIDIA . Se basa en el liderazgo de F5 a la hora de abordar desafíos críticos de seguridad y entrega de aplicación durante momentos clave del mercado, al tiempo que aprovecha las innovaciones de NVIDIA en computación acelerada y redes de alto rendimiento.

F5 BIG-IP Next SPK se desarrolló para resolver los problemas que enfrentaron los proveedores de servicios con Kubernetes durante su transición a 5G. La infraestructura 5G está construida sobre una arquitectura en contenedores nativa de la nube, con cargas de trabajo de contenedores administradas mediante Kubernetes. Sin embargo, Kubernetes no fue pensado originalmente para los casos de uso complejos que requiere un entorno 5G. BIG-IP Next SPK ayudó a las empresas de telecomunicaciones a adaptar la red Kubernetes para una infraestructura 5G, brindándoles la visibilidad, el control y la seguridad que necesitaban para escalar dinámicamente sus redes 5G. En los últimos años, los proveedores de servicios han utilizado BIG-IP para dar vida a la tecnología 5G para millones de suscriptores.

Así como BIG-IP Next SPK jugó un papel fundamental al permitir 5G Core para la última inflexión del mercado, ahora está evolucionando para abordar los desafíos de la inflexión del mercado de IA y la entrega de carga de trabajo de IA, que comparten similitudes con las cargas de trabajo de 5G, pero involucran volúmenes de tráfico exponencialmente mayores. Para satisfacer las demandas de esta nueva inflexión del mercado, F5 está lanzando BIG-IP Next para Kubernetes implementado en DPU NVIDIA BlueField-3 para administrar de manera eficaz el gran tráfico dirigido a los servidores de IA.

Esta solución transforma la entrega de aplicación modernas para satisfacer las demandas de la IA generativa. Es una implementación nativa de Kubernetes de la plataforma BIG-IP de F5 que gestiona las cargas de trabajo de red, seguridad y balanceo de carga, y se ubica en el punto de demarcación entre el clúster de IA y otras partes de los centros de datos. BIG-IP Next para Kubernetes asigna espacios de nombres de clústeres de IA a la tenencia de la red del centro de datos, lo que brinda seguridad adecuada y una administración simplificada. Al aprovechar los aceleradores de hardware de la DPU BlueField-3, BIG-IP Next para Kubernetes acelera una variedad de servicios de redes y datos, optimizando la eficiencia energética al descargar los recursos informáticos de la CPU.

Por ejemplo, en su evento Networking @Scale 2024 a principios de este año, Meta mencionó que el entrenamiento de su modelo de lenguaje de aprendizaje (LLM) de código abierto Llama 3 se vio obstaculizado por la latencia de la red, que se solucionó ajustando las interacciones hardware-software. Este enfoque incrementó el rendimiento general en un 10%. Si bien el 10% puede parecer una ganancia pequeña, para un modelo que tarda meses en entrenarse, esta mejora se traduce en semanas de tiempo ahorrado.

Reducción de la complejidad de las implementaciones de IA

F5 BIG-IP Next para Kubernetes implementado en DPU BlueField-3 ofrece múltiples beneficios para proveedores de servicios y grandes empresas que buscan desarrollar infraestructuras de IA a gran escala. Estos incluyen:

Integración simplificada: Hasta ahora, las organizaciones enfrentaban la complejidad de reunir componentes de software de diferentes proveedores para entregar y proteger sus aplicaciones de IA. BIG-IP Next para Kubernetes combina redes, seguridad, gestión de tráfico y equilibrio de carga en una única solución, lo que simplifica la complejidad de las implementaciones de IA. También ofrece una vista integrada de estas funciones en toda la infraestructura de IA, junto con la gran capacidad de observación y el control granular necesarios para optimizar las cargas de trabajo de IA.
Seguridad mejorada: BIG-IP Next para Kubernetes admite funciones de seguridad críticas y arquitectura de confianza cero, incluido firewall de borde, mitigación de denegación de servicio distribuido (DDoS), protección de API, prevención de intrusiones, cifrado y administración de certificados, descargando estas funciones a la DPU y liberando valiosos recursos de CPU.
Rendimiento mejorado: BIG-IP Next para Kubernetes acelera la red y la seguridad, lo cual es fundamental para satisfacer las demandas de la infraestructura de IA para entregar aplicaciones a escala de la nube.
Soporte para múltiples inquilinos: BIG-IP Next para Kubernetes permite una arquitectura multiinquilino para que los proveedores de servicios puedan alojar de forma segura a múltiples usuarios en la misma infraestructura de IA, mientras mantienen sus cargas de trabajo y datos de IA separados.

Entrega exitosa de centros de datos optimizados para IA

Al considerar cuidadosamente los desafíos y las soluciones disponibles, las organizaciones pueden brindar con éxito centros de datos optimizados para IA sin interrumpir las operaciones existentes ni comprometer la seguridad. F5 BIG-IP Next para Kubernetes implementado en DPU BlueField-3 surge como una opción atractiva que brinda una integración perfecta, seguridad mejorada y un rendimiento mejorado para cargas de trabajo de IA, incluidos LLM a gran escala como Llama 3.

Para obtener más información, lea nuestro comunicado de prensa y la publicación del blog de NVIDIA .

F5 ayuda a proveedores de servicios y empresas a aprovechar al máximo el potencial de las implementaciones de IA con las DPU NVIDIA BlueField-3.

La dificultad de lograr un rendimiento óptimo

Gestión eficiente del gran tráfico dirigido a los servidores de IA.

Reducción de la complejidad de las implementaciones de IA

Entrega exitosa de centros de datos optimizados para IA

Entrega y protege cada aplicación

CONTACTA CON NOSOTROS