BLOG

Anunciando a disponibilidade geral do F5 BIG-IP Next para Kubernetes em DPUs NVIDIA BlueField-3

Ahmed Guetari Miniatura
Ahmed Guetari
Publicado em 25 de abril de 2025

Hoje, a F5 está anunciando a disponibilidade geral do F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3 , aprimorando o gerenciamento de recursos de data center em nuvem de fábrica de IA e, ao mesmo tempo, alcançando desempenho ideal de application de IA. A solução integrada aumenta a eficiência da infraestrutura e oferece rede de alto desempenho, segurança e gerenciamento de tráfego para dar suporte a casos de uso inovadores, incluindo GPU como serviço (GPUaaS) e recursos de inferência.

A integração do BIG-IP Next para Kubernetes com DPUs NVIDIA BlueField-3 aborda os desafios urgentes que as organizações enfrentam na implementação de infraestruturas de IA em escala de nuvem. Cargas de trabalho de IA em larga escala envolvem processamento massivo de dados que exigem recursos de computação de alto desempenho para analisar, interpretar e extrair insights em tempo real. Isso coloca uma pressão considerável na infraestrutura de rede tradicional, inibindo o desempenho e arriscando ineficiência de processamento e atrasos de inferência.

Desempenho em ambientes que definem o setor

A F5, a NVIDIA e a SoftBank colaboraram recentemente em uma sessão na NVIDIA GTC 2025 para mostrar o valor de uma solução combinada. Durante a sessão, a SoftBank compartilhou insights inovadores sobre como as organizações podem turbinar cargas de trabalho de IA nativas da nuvem com proxy de serviço acelerado por DPU para Kubernetes . A sessão apresentou os cálculos e métricas de desempenho da SoftBank de sua recente prova de conceito para o F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3. A SoftBank obteve um aumento de 18% na taxa de transferência de HTTP (77 Gbps), uma melhoria de 11x no tempo até o primeiro byte (TTFB) e um aumento impressionante de 190x na eficiência energética da rede. Esses resultados destacam o potencial transformador da aceleração de DPU para ambientes nativos de nuvem modernos, gerando melhor rendimento de tokens e experiências de usuário aprimoradas durante a inferência de IA.

Menos complexidade, desempenho otimizado e segurança aprimorada

As DPUs NVIDIA BlueField-3 são projetadas para as cargas de trabalho de infraestrutura mais exigentes, desde IA acelerada e redes sem fio 5G até nuvem híbrida e computação de alto desempenho. A solução combinada aproveita a plataforma de entrega e segurança de application F5 para acelerar, proteger e otimizar o tráfego de dados conforme ele flui para dentro e para fora das infraestruturas de IA, melhorando significativamente o processamento eficiente de cargas de trabalho de IA em larga escala. Ao fornecer gerenciamento de tráfego otimizado, a solução permite maior desempenho de ingestão de dados e utilização do servidor durante a inferência de IA, resultando em melhores experiências para usuários de aplicativos de IA.

O BIG-IP Next para Kubernetes facilita significativamente a complexidade da integração de vários elementos da infraestrutura de IA empresarial ao unificar funções de rede, segurança, gerenciamento de tráfego e balanceamento de carga para fornecer visibilidade abrangente em ambientes multinuvem, com maior capacidade de observação para cargas de trabalho de IA. A solução oferece suporte a recursos de segurança críticos para arquiteturas de confiança zero, proteção de API, prevenção de intrusão, criptografia e gerenciamento de certificados. Com disponibilidade geral, a mitigação de negação de serviço distribuída (DDoS) acelerada por hardware foi adicionada, juntamente com recursos de firewall de borda, promovendo proteção cibernética mais rápida e eficiente. A solução também automatiza a descoberta e a proteção de endpoints de treinamento e inferência de modelos de IA, capacitando as organizações a isolar applications de IA de ameaças direcionadas, ao mesmo tempo em que reforça a integridade e a soberania dos dados.

Além disso, a integração do BIG-IP Next para Kubernetes e das DPUs NVIDIA BlueField-3 permite uma arquitetura multilocatário que pode hospedar com segurança vários usuários nos mesmos clusters de IA, mantendo suas cargas de trabalho de IA, dados e tráfego separados.

Novos casos de uso atraentes para ajudar os clientes a adotar a IA

Juntas, a F5 e a NVIDIA não apenas melhoram o gerenciamento e a eficiência da infraestrutura, mas também permitem inferências de IA mais rápidas e responsivas para fornecer casos de uso emergentes, como:

  • GPU como serviço (GPUaaS) fornece acesso sob demanda baseado em nuvem a GPUs para uma variedade de tarefas de computação, incluindo treinamento de modelos de IA, simulações científicas e renderização. O serviço permite que organizações aluguem recursos de computação de GPU de provedores de nuvem com pagamento conforme o uso ou assinatura, pagando pelas GPUs somente quando necessário e maximizando a quantidade de computação de GPU que podem obter por dólar gasto. A integração do BIG-IP Next para Kubernetes com DPUs NVIDIA BlueField-3 permite multilocação segura com isolamento granular de locatário, o que é essencial para cenários de GPUaaS porque permite que vários usuários ou organizações compartilhem recursos de GPU de forma segura e eficiente enquanto executam cargas de trabalho simultâneas. Ao dividir o serviço de GPU em várias instâncias seguras, a multilocação granular isola diferentes locatários e cargas de trabalho para evitar vazamento de dados e riscos de segurança. Ele também permite alocação dinâmica de recursos, o que garante que cada carga de trabalho receba os recursos de GPU e rede necessários sem provisionamento excessivo.
  • Serviços de inferência , nos quais plataformas de IA especializadas baseadas em nuvem fornecem ambientes otimizados para fornecer inferências de forma eficiente em modelos de IA treinados. Diferentemente do GPUaaS, que fornece potência bruta de GPU, os serviços de inferência são ajustados para uma implantação simplificada de modelos. Exemplos desses serviços incluem operar chatbots, implementar detecção de fraudes, realizar pesquisas e executar tarefas semelhantes com tecnologia de IA. Serviços de inferência também são usados para otimizar o reconhecimento de imagens e cenários de direção autônoma, juntamente com processamento de linguagem natural para assistentes de voz ou análise de sentimentos. O BIG-IP Next para Kubernetes e as DPUs NVIDIA BlueField-3 maximizam o desempenho de inferência e reduzem a latência de ponta a ponta executando vários modelos simultaneamente. Os serviços de inferência baseados na solução combinada F5 e NVIDIA também podem dimensionar recursos dinamicamente para lidar com cargas de trabalho e demandas flutuantes.

Tanto para GPUaaS quanto para serviços de inferência , a observabilidade granular é um requisito crítico. O BIG-IP Next para Kubernetes fornece uma visão centralizada e totalmente integrada que oferece ampla visibilidade em todo o ecossistema de IA para monitorar o desempenho e a resiliência, com a capacidade de aplicar instantaneamente recursos de segurança para impor a privacidade de dados, impedir acesso não autorizado e isolar anomalias.

Para obter mais informações, explore a página do produto ou entre em contato com sua equipe de contas da F5 para discutir o BIG-IP Next para Kubernetes para a infraestrutura de IA da sua organização. O foco da F5 em IA não para por aqui: explore como a F5 protege e entrega aplicativos de IA em qualquer lugar .