Uma unidade de processamento de dados (DPU) é um processador especializado projetado para descarregar e acelerar tarefas centradas em dados, liberando unidades centrais de processamento (CPUs) para processar cargas de trabalho específicas do aplicativo. Projetadas para processar redes de alta velocidade, solicitações de armazenamento e processamento de segurança, as DPUs são adequadas para data centers modernos de alta densidade e demandas de computação de alto desempenho (HPC).
DPUs e suas contrapartes, unidades de processamento de infraestrutura (IPUs), atendem à necessidade de descarregar tarefas comuns e de alto desempenho das CPUs. A redução de tarefas de criptografia, operações de E/S de armazenamento e processamento de pacotes de rede de alta largura de banda permite que as CPUs visem tarefas de application de maior densidade exigidas por applications baseados em contêineres, particionamento de nuvem ou hipervisor e tarefas intensivas de computação de inteligência artificial (IA).
Várias funções principais incluem:
Otimizar o desempenho da CPU para tarefas específicas de aplicativos em ambientes HCI e HPC é cada vez mais importante, pois a densidade de computação e o uso de energia se tornam novas métricas para benefícios de custo de infraestrutura. Os avanços nas velocidades de rede e na redução de latência, no desempenho do armazenamento e a necessidade de fornecer recursos de computação a mais usuários sobrecarregam ainda mais as tarefas não específicas de aplicativos exigidas das CPUs. As medidas de sucesso atualmente aceitas, adotadas no setor de HPC, são definidas pela densidade e desempenho da CPU.
As proporções de pontos de dados de poder de processamento incluem, mas não estão limitadas a:
Usadas há muito tempo por HPCs para medir o desempenho de supercomputadores no lançamento e ao longo do tempo, essas medições estão sendo cada vez mais aplicadas a data centers tradicionais à medida que a tecnologia entre os dois setores continua a convergir.
As DPUs fornecem uma maneira de aumentar a disponibilidade da CPU para pipelines de application e computação intensivos, o que pode causar gargalos se a CPU for necessária para lidar com tarefas não computacionais de nível inferior. Essas tarefas são agravadas quando as densidades e tarefas de application aumentam, então as DPUs fornecem uma maneira de aliviar esse gargalo. Ao adicionar DPUs à infraestrutura do data center, as CPUs são liberadas para fornecer melhor desempenho por núcleo. Como alternativa, os recursos de computação podem ser particionados e alocados para permitir que mais usuários acessem os recursos do sistema.
Com base em seu sucesso na utilização de tecnologias SmartNICs, ASIC e FPGA, a F5 aproveita o processamento e a localização do tráfego em linha de uma DPU dentro da infraestrutura de computação para aumentar e melhorar a capacidade de carga de trabalho, o desempenho e a segurança das infraestruturas HCI/HPC.
Aproveitando as DPUs NVIDIA Bluefield-3, a F5 oferece vários benefícios para provedores de serviços e grandes empresas que buscam desenvolver recursos de computação em larga escala e, ao mesmo tempo, maximizar os recursos de computação. Isso inclui, mas não está limitado a:
Para mais informações sobre soluções integradas DPU e F5, clique nos recursos à direita.
1As medições padrão para medições de HPC com base científica tradicionalmente consistiam em precisão de ponto flutuante de precisão simples ou dupla (FP32 e FP64). As tendências atuais de IA agora medem o desempenho pela metade ou menos (FP16). O uso de endereçamento de memória de menor precisão (tipos de dados de ponto flutuante e inteiros) permite treinamento mais rápido e menores ocupações de memória de modelos de linguagem.