Nos últimos meses, a F5 discutiu profundamente as fábricas de IA. No início da nossa série, definimos uma fábrica de IA como um grande investimento em armazenamento, rede e computação que atende a requisitos de treinamento e inferência de alto volume e alto desempenho. As fábricas de IA, no final das contas, são uma analogia de como os modelos e serviços de IA são criados, refinados e implantados. Assim como uma fábrica tradicional transforma materiais em produtos acabados, as fábricas de IA criam aplicativos de IA.
Neste artigo do blog, descreveremos as semelhanças e diferenças entre um aplicativo de IA e um aplicativo moderno, destacando as necessidades de entrega e segurança e discutindo esses aplicativos de IA modernos no contexto da Arquitetura de Referência de IA F5 .
Os aplicativos modernos passaram por uma evolução significativa, impulsionados pela necessidade de agilidade, escalabilidade e experiências aprimoradas do usuário. O advento da computação em nuvem marcou um ponto crucial nessa evolução, fornecendo a base para sistemas altamente distribuídos que podem ser dimensionados com eficiência e operar perfeitamente em vários ambientes. A modernização de aplicativos é a evolução para sistemas baseados em API, o que levou a arquitetura a ser híbrida e multicloud.
Os aplicativos de IA aumentam a dependência de APIs e estabelecem a nuvem híbrida e a multinuvem como o novo normal. As tecnologias de conteinerização revolucionaram ainda mais a implantação de aplicativos ao permitir ambientes consistentes e isolados para software, independentemente da infraestrutura subjacente. Esses avanços não são apenas essenciais para aplicações modernas tradicionais, mas também servem como base para fábricas de IA. A agilidade proporcionada pela computação em nuvem e pela conteinerização é essencial para gerenciar as demandas computacionais intensivas de treinamento e implantação de modelos de IA.
Ferramentas de orquestração como o Kubernetes são essenciais para gerenciar aplicativos em contêineres em escala. O Kubernetes automatiza a implantação, o dimensionamento e o gerenciamento desses aplicativos. Em fluxos de trabalho de IA, o Kubernetes coordena a implantação de cargas de trabalho de IA em vários sistemas, alocando recursos de forma eficiente e permitindo o dimensionamento perfeito de modelos de IA.
Um aspecto crítico desse processo é o MLOps, que aborda os desafios exclusivos de desenvolver, treinar e operacionalizar modelos de IA. O MLOps oferece suporte à integração e entrega contínuas (CI/CD), garantindo que os modelos de IA sejam continuamente testados, atualizados e implantados. Além disso, a adoção de arquiteturas de microsserviços transformou o desenvolvimento de aplicativos modernos ao dividir sistemas monolíticos em serviços menores e implantáveis de forma independente. Essa abordagem acelera o CI/CD, resultando em atualizações de software mais rápidas e confiáveis.
A segurança sempre foi um pilar fundamental na evolução dos aplicativos modernos. Com o surgimento de ameaças cibernéticas sofisticadas, os aplicativos modernos integraram medidas de segurança avançadas, como firewalls de aplicativos da web (WAF), proteção contra negação de serviço distribuída (DDoS) e segurança de API. É crucial distinguir entre ataques DDoS de Camada 3/4 direcionados às camadas de rede e transporte e ataques DoS de Camada 7 direcionados à camada de aplicação.
À medida que a IA avança, o modelo de ameaça evolui, especialmente para modelos de grande linguagem (LLMs) acessados por meio de interfaces de processamento de linguagem natural (NLP). Os riscos para LLMs incluem vulnerabilidades como aquelas destacadas pelo OWASP Top 10 para aplicativos LLM, como ataques de injeção rápida e ameaças de extração de dados, juntamente com ataques DoS específicos do modelo. Esses avanços de segurança garantem que os aplicativos de IA permaneçam resilientes e seguros, mantendo a integridade e a confiabilidade das soluções baseadas em IA contra ameaças em evolução.
Se você acompanha nossa série sobre fábricas de IA, exploramos tópicos como segurança de API , segmentação de rede , gerenciamento de tráfego , geração aumentada de recuperação (RAG) e unidades de processamento de dados (DPUs) . Vamos dar um passo para trás e discutir como uma fábrica de IA se encaixa na Arquitetura de Referência de IA F5, como as fábricas de IA produzem aplicativos de IA e os requisitos para entregá-los e protegê-los.
Com base em nossas quase três décadas de experiência ajudando clientes a entregar aplicativos de alto desempenho, a F5 desenvolveu uma Arquitetura de Referência de IA que inclui sete blocos de construção (inferência, RAG, gerenciamento de corpus RAG, ajuste fino, treinamento, integração de serviços externos e desenvolvimento) e quatro tipos de implantação (IA-SaaS, hospedado na nuvem, auto-hospedado e hospedado na borda). Para mais informações sobre isso, visite nosso blog definindo uma fábrica de IA . Como os aplicativos de IA são os mais modernos dos aplicativos modernos, conectados com APIs e extremamente distribuídos, esta arquitetura de referência aborda desafios de desempenho, operações e segurança essenciais para a entrega de aplicativos de IA.
Dois dos blocos de construção mais comuns para fábricas de IA são treinamento e inferência; no entanto, cada bloco de construção é necessário para criar um aplicativo de IA totalmente funcional. Algumas organizações podem criar uma fábrica de IA para lidar com funções necessárias para treinamento ou inferência. Outros podem depender de terceiros para consumir serviços de treinamento de modelos ou fornecer infraestrutura para inferência.
Os aplicativos de IA no núcleo são distribuídos, possivelmente sendo executados em plataformas de contêineres Kubernetes distribuídas. Esta é a própria definição de uma aplicação moderna e de onde vem nossa frase, “uma aplicação de IA é simplesmente a mais moderna das aplicações modernas”. Mas o que isso significa para as empresas que constroem fábricas de IA? Os aplicativos de IA precisam dos mesmos serviços de entrega e segurança dos aplicativos modernos de hoje, como entrada no Kubernetes, saída multilocatário, gerenciamento de tráfego baseado em DNS, resiliência e observabilidade. Para segurança, são necessárias tecnologias de proteção DDoS, proteção de aplicativos da web e API e otimização.
Embora possa parecer surpreendente que nos concentremos em recursos de entrega e segurança comuns à IA e aos aplicativos modernos, em vez de apenas em preocupações de segurança específicas da IA, essa abordagem é intencional. Os aplicativos de IA apresentam riscos exclusivos, mas, muitas vezes, os princípios básicos de segurança e entrega de aplicativos são negligenciados em favor de recursos novos e inovadores. Ao abordar primeiro as necessidades compartilhadas de segurança e entrega — o que chamamos de "fruto mais fácil de colher" — as organizações podem fazer melhorias imediatas usando sua experiência existente em segurança de aplicativos. Embora os aplicativos de IA possam envolver novos componentes, eles ainda dependem muito de interações da Web e de API, que estão dentro das capacidades das equipes atuais de NetOps e SecOps. Ao começar com estratégias comprovadas de segurança e entrega, as equipes podem construir uma base sólida e enfrentar gradualmente os desafios exclusivos impostos pelos aplicativos de IA.
Destaques da arquitetura de referência F5 AI não apenas a produção da fábrica de IA, mas também os desafios e riscos para tornar a aplicação de IA bem-sucedida para os objetivos de negócios da organização. Para fazer isso, decidimos usar um par de listas complementares de 10 principais riscos e desafios: o OWASP Top 10 para aplicações de LLM e o F5 Application Delivery Top 10 . Mapeamos cada componente e interconexão dos blocos de construção e descrevemos onde o OWASP LLM Top 10 aplicável e o F5 Application Delivery Top 10 se aplicam. No caso abaixo, veja um exemplo de Inferência de IA.
A arquitetura de referência de IA do F5 destacando o bloco de construção de inferência com o F5 Application Delivery Top 10 e o OWASP LLM Top 10 sobrepostos.
Cada componente e ponto de interconexão dentro de um aplicativo de IA se beneficia das proteções de entrega e segurança bem estabelecidas, projetadas para aplicativos modernos. Isso não quer dizer que essas proteções convencionais sejam suficientes apenas para proteger aplicativos de IA. Ao aproveitar essas soluções comprovadas de entrega e segurança como base, as organizações podem obter uma melhoria significativa na postura de entrega e segurança de seus aplicativos de IA. A partir desse ponto de partida sólido, as equipes podem desenvolver progressivamente habilidades especializadas e adotar as ferramentas avançadas necessárias para enfrentar os desafios e riscos específicos apresentados pelas aplicações de IA.
No momento, a Arquitetura de Referência de IA do F5 está disponível como uma prévia . Os clientes terão a oportunidade de explorar a Arquitetura de Referência de IA completa em uma experiência interativa a partir do final do mês que vem na AppWorld , a principal conferência de segurança e entrega de aplicativos da F5.
A F5 é líder em entrega e segurança de aplicativos . Soluções como o F5 BIG-IP fornecem serviços essenciais, incluindo balanceamento de carga, gerenciamento de tráfego e segurança. Esses recursos comumente conhecidos para aplicações tradicionais são igualmente essenciais para que aplicações de IA ofereçam os mais altos níveis de confiabilidade, desempenho e proteção.
Para empresas que criam fábricas de IA, os recursos nos quais você confia da F5 para entrega e segurança de aplicativos são os recursos necessários para fábricas de IA. O F5 BIG-IP Local Traffic Manager , combinado com hardware desenvolvido especificamente com F5 rSeries e VELOS , permite ingestão de dados de alto desempenho para treinamento e ajuste fino, além de proteger aplicativos de IA das ameaças de segurança mais exigentes. Os Serviços de Nuvem Distribuída da F5 permitem redes multicloud seguras e proteção de APIs e aplicativos da web. E, anunciado recentemente, o F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3 transfere o gerenciamento de tráfego e a segurança da CPU para a DPU para infraestrutura de IA em larga escala, desbloqueando maior eficiência, controle e desempenho para aplicativos de IA.
Para saber mais sobre como a F5 pode proteger e dimensionar fábricas de IA, entre em contato com sua equipe de contas da F5 hoje mesmo. O foco da F5 em IA não para por aqui: explore como a F5 protege e entrega aplicativos de IA em qualquer lugar .
Interessado em aprender mais sobre fábricas de IA? Explore outros temas em nossa série de blogs sobre fábrica de IA: