BLOG

Cargas de trabalho de IA multicloud AWS: proteja e dimensione APIs para IA

Miniatura de Dave Morrissey
Dave Morrissey
Publicado em 09 de setembro de 2025

Você sabia que 94% das organizações implantam aplicativos em vários ambientes, incluindo uma combinação de instâncias em nuvem pública, data centers privados e sistemas de borda? Vivemos na era da multinuvem híbrida, e isso faz sentido ao considerar os benefícios. Nos ambientes multicloud, as empresas não ficam presas a um único fornecedor e podem escolher os serviços e tipos de instância que melhor atendem a cada carga de trabalho, incluindo IA.

Porém, a IA multinuvem apresenta desafios específicos. Para garantir precisão e eficiência, você precisa alimentar a IA com dados constantes, conectando perfeitamente os repositórios em vários ambientes. As cargas de trabalho de IA também são muito dinâmicas, indo desde prompts simples de perguntas e respostas até análises profundas ou criação de conteúdo que utilizam recursos de GPU de maneira desigual.

Além disso, o cenário de ameaças cibernéticas se tornou mais complexo porque a IA surgiu como um vetor próprio de ataque, com técnicas como injeção de prompts e jailbreaking de modelos. A IA também utiliza muitas conexões de API — devido à sua intensa demanda por dados — o que amplia a superfície de ataque e eleva o risco de movimentação lateral originada pela IA dentro da rede.

Ainda não falamos sobre a expansão descontrolada da multicloud. Conforme você adiciona mais ambientes, conexões e complexidade, fica muito mais difícil gerenciar e ter visibilidade completa de tudo.

Vencendo desafios da IA em ambientes multinuvem para maximizar valor

A boa notícia é que existe um guia para superar esses desafios, que foca na combinação dos principais elementos da infraestrutura para criar caminhos seguros e de alta performance para IA. A configuração básica é assim:

  • Um backbone de conectividade privado oferece uma vantagem clara em comparação ao uso da Internet pública para conectar ambientes distintos. Backbones privados garantem uma conectividade segura e confiável, protegendo você de fatores externos ao seu controle.
  • O gerenciamento de tráfego inteligente usa instruções de roteamento com inteligência artificial para equilibrar melhor as cargas de trabalho entre os contêineres e evitar a superutilização ou subutilização de recursos caros de GPU.
  • Estruturas de segurança unificadas aplicam as mesmas proteções (criptografia, autenticação, etc.) de forma consistente além dos limites da nuvem. Ou seja, as mesmas políticas de segurança e privacidade protegem tanto instâncias em nuvem pública quanto servidores privados e sistemas de borda.
  • Plataformas de orquestração centralizadas conectam tudo e proporcionam visibilidade completa, de ponta a ponta. A plataforma de orquestração ideal também exibe métricas específicas de IA, como tempos de carregamento do modelo e latência de inferência, para apoiar seus esforços de otimização.

Ao marcar essas opções, você alcança o ponto ideal da IA multinuvem, movendo dados com segurança e integração para onde precisar, apoiando treinamento de modelo, ajuste, inferência, otimização e casos avançados como geração aumentada por recuperação (RAG).

Infraestrutura multinuvem preparada para IA ao seu alcance

Sem dúvida, a forma mais rápida de realizar suas ambições de IA multinuvem é adotando soluções comprovadas de fornecedores confiáveis. As soluções F5 complementam os serviços da AWS que você provavelmente já utiliza — como Amazon Bedrock para modelos de IA gerenciados ou Amazon SageMaker para desenvolver sua própria IA — oferecendo a conexão que integra ambientes multicloud em uma infraestrutura coesa.

  • F5 Global Network oferece conectividade privada, segura e de alto desempenho entre ambientes, sem exposição à Internet pública. Diversos pontos de presença globais mantêm seus dados locais, garantindo respostas rápidas.
  • F5 AI Gateway oferece gerenciamento de tráfego inteligente com balanceamento de carga avançado para IA em contêineres. Também protegemos modelos de IA contra injeção de comandos e outras práticas abusivas que provocam vazamento de dados, usando controles de segurança integrados e validação de entrada e saída.
  • Os F5 Distributed Cloud Services oferecem visibilidade e controle completos, conectando ambientes de nuvem, borda e on-premises com implantações a um clique. Você pode aplicar políticas de governança de TI e dados de forma consistente em todos os ambientes com facilidade.

Para clientes NetApp, a F5 e a AWS trabalham com as soluções de armazenamento NetApp, incluindo NetApp BlueXP e NetApp ONTAP, para proporcionar acesso a essas capacidades unificadas de gerenciamento e migração de dados, fortalecendo e impulsionando seus projetos de IA multinuvem.

A Rede Global F5 capacita você a conectar ambientes variados com segurança, sem expor nada à Internet pública.

A F5 Global Network permite que você conecte ambientes variados com segurança, sem expor a rede à Internet pública.

RAG e computação de borda estão vivendo seus momentos

RAG usa dados proprietários da sua organização para aumentar a precisão do modelo com conhecimento específico do domínio, sendo um requisito quase obrigatório para todos os chatbots, exceto os mais genéricos. Por se tratar de dados proprietários, eles têm maior valor e foco de vulnerabilidade. F5 Distributed Cloud Network Connect protege esses dados durante a movimentação em ambientes multicloud híbridos, oferecendo conectividade segura na camada 3 e suporte para protocolos Amazon S3.

A borda da rede tem grande potencial para melhorar a IA, processando e inferindo dados mais próximo de onde são gerados, entregando resultados mais rápidos e com menor latência. O F5 Distributed Cloud Customer Edge facilita a conexão segura de pontos de borda a modelos gerenciados centralmente pelo Distributed Cloud Services. Esta solução se integra ao AI Gateway, permitindo que você leve serviços de IA e segurança baseados em Kubernetes até a borda, funcionando também com serviços de borda como AWS Local Zones e AWS Outposts.

Simplifique a complexidade da IA em multicloud híbrida

A IA híbrida multicloud é complexa, mas oferece muitas vantagens ao conectar diversos repositórios de dados e serviços aos seus modelos de IA, onde você precisar. A parceria entre F5 e AWS supera os desafios multicloud ao oferecer segurança focada em IA, ferramentas unificadas de gerenciamento e conectividade de IA através de uma infraestrutura global de rede. Com essas soluções, você constrói a IA segura, flexível e escalável necessária para prosperar na economia atual da IA.

Saiba mais sobre a F5 na Amazon Web Services (AWS).

Confira também meus posts anteriores:

Proteja a inovação em IA na AWS com segurança de APIs

Construa pipelines de dados ágeis e seguros para treinamento de IA na AWS