Hoje, a F5 está anunciando a disponibilidade geral do F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3 , aprimorando o gerenciamento de recursos de data center em nuvem de fábrica de IA e, ao mesmo tempo, alcançando desempenho ideal de application de IA. A solução integrada aumenta a eficiência da infraestrutura e oferece rede de alto desempenho, segurança e gerenciamento de tráfego para dar suporte a casos de uso inovadores, incluindo GPU como serviço (GPUaaS) e recursos de inferência.
A integração do BIG-IP Next para Kubernetes com DPUs NVIDIA BlueField-3 aborda os desafios urgentes que as organizações enfrentam na implementação de infraestruturas de IA em escala de nuvem. Cargas de trabalho de IA em larga escala envolvem processamento massivo de dados que exigem recursos de computação de alto desempenho para analisar, interpretar e extrair insights em tempo real. Isso coloca uma pressão considerável na infraestrutura de rede tradicional, inibindo o desempenho e arriscando ineficiência de processamento e atrasos de inferência.
A F5, a NVIDIA e a SoftBank colaboraram recentemente em uma sessão na NVIDIA GTC 2025 para mostrar o valor de uma solução combinada. Durante a sessão, a SoftBank compartilhou insights inovadores sobre como as organizações podem turbinar cargas de trabalho de IA nativas da nuvem com proxy de serviço acelerado por DPU para Kubernetes . A sessão apresentou os cálculos e métricas de desempenho da SoftBank de sua recente prova de conceito para o F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3. A SoftBank obteve um aumento de 18% na taxa de transferência de HTTP (77 Gbps), uma melhoria de 11x no tempo até o primeiro byte (TTFB) e um aumento impressionante de 190x na eficiência energética da rede. Esses resultados destacam o potencial transformador da aceleração de DPU para ambientes nativos de nuvem modernos, gerando melhor rendimento de tokens e experiências de usuário aprimoradas durante a inferência de IA.
As DPUs NVIDIA BlueField-3 são projetadas para as cargas de trabalho de infraestrutura mais exigentes, desde IA acelerada e redes sem fio 5G até nuvem híbrida e computação de alto desempenho. A solução combinada aproveita a plataforma de entrega e segurança de application F5 para acelerar, proteger e otimizar o tráfego de dados conforme ele flui para dentro e para fora das infraestruturas de IA, melhorando significativamente o processamento eficiente de cargas de trabalho de IA em larga escala. Ao fornecer gerenciamento de tráfego otimizado, a solução permite maior desempenho de ingestão de dados e utilização do servidor durante a inferência de IA, resultando em melhores experiências para usuários de aplicativos de IA.
O BIG-IP Next para Kubernetes facilita significativamente a complexidade da integração de vários elementos da infraestrutura de IA empresarial ao unificar funções de rede, segurança, gerenciamento de tráfego e balanceamento de carga para fornecer visibilidade abrangente em ambientes multinuvem, com maior capacidade de observação para cargas de trabalho de IA. A solução oferece suporte a recursos de segurança críticos para arquiteturas de confiança zero, proteção de API, prevenção de intrusão, criptografia e gerenciamento de certificados. Com disponibilidade geral, a mitigação de negação de serviço distribuída (DDoS) acelerada por hardware foi adicionada, juntamente com recursos de firewall de borda, promovendo proteção cibernética mais rápida e eficiente. A solução também automatiza a descoberta e a proteção de endpoints de treinamento e inferência de modelos de IA, capacitando as organizações a isolar applications de IA de ameaças direcionadas, ao mesmo tempo em que reforça a integridade e a soberania dos dados.
Além disso, a integração do BIG-IP Next para Kubernetes e das DPUs NVIDIA BlueField-3 permite uma arquitetura multilocatário que pode hospedar com segurança vários usuários nos mesmos clusters de IA, mantendo suas cargas de trabalho de IA, dados e tráfego separados.
Juntas, a F5 e a NVIDIA não apenas melhoram o gerenciamento e a eficiência da infraestrutura, mas também permitem inferências de IA mais rápidas e responsivas para fornecer casos de uso emergentes, como:
Tanto para GPUaaS quanto para serviços de inferência , a observabilidade granular é um requisito crítico. O BIG-IP Next para Kubernetes fornece uma visão centralizada e totalmente integrada que oferece ampla visibilidade em todo o ecossistema de IA para monitorar o desempenho e a resiliência, com a capacidade de aplicar instantaneamente recursos de segurança para impor a privacidade de dados, impedir acesso não autorizado e isolar anomalias.
Para obter mais informações, explore a página do produto ou entre em contato com sua equipe de contas da F5 para discutir o BIG-IP Next para Kubernetes para a infraestrutura de IA da sua organização. O foco da F5 em IA não para por aqui: explore como a F5 protege e entrega aplicativos de IA em qualquer lugar .