À medida que as organizações adotam cada vez mais tecnologias de IA, elas descobriram que manter grandes modelos de linguagem (LLMs) atualizados com seus dados proprietários mais recentes pode ser um desafio. Isso levou à adoção da geração aumentada de recuperação (RAG), que adiciona dados suplementares para aprimorar a inferência de IA para respostas mais precisas e úteis. Levar esses dados adicionais ao LLM com segurança pode ser desafiador, exigindo uma solução para conectividade segura.
Os LLMs tradicionais, embora poderosos, são limitados por seus dados de treinamento e não conseguem acessar informações específicas da organização. O RAG permite que os LLMs consultem fontes de conhecimento externas durante a geração, produzindo saídas que refletem tanto o amplo conhecimento do modelo quanto os dados proprietários de uma organização.
No entanto, como a maioria das organizações migrou para ambientes de TI híbridos e multinuvem, seus dados geralmente estão espalhados por diversas fontes. Essa distribuição dificulta a implementação eficaz do RAG, pois as organizações devem garantir acesso seguro a todas as fontes de dados relevantes, mantendo o desempenho e a eficiência de custos em escala. Resolver esse desafio requer um meio de conectar com segurança os armazenamentos de dados em todas as fontes com LLMs, e é por isso que a F5, a NetApp e o Google Cloud se uniram para oferecer uma solução.
Um fluxo de trabalho RAG básico que inclui um recuperador para obter dados relevantes de um grande modelo de linguagem, combinando-os com o contexto necessário para gerar informações precisas e contextualmente relevantes.
Os Serviços de Nuvem Distribuída da F5 incluem redes multinuvem seguras para conectar aplicativos e dados entre nuvens e ambientes locais. Usando o backbone privado da F5 Rede Global, o F5 Distributed Cloud Network Connect trabalha com a NetApp para mover e armazenar dados de forma rápida e segura onde e quando for necessário.
Especificamente para o RAG, o Distributed Cloud Network Connect conecta o armazenamento NetApp na nuvem ou no local aos LLMs , incluindo a plataforma Vertex AI do Google Cloud, para inferência segura, rápida e relevante. Esta solução cria uma estrutura perfeita para acessar fontes de dados distribuídas em ambientes híbridos e multinuvem.
Os recursos de rede multicloud segura da F5 servem como base, permitindo acesso eficiente e protegido a dados em diferentes ambientes, mantendo a observabilidade e a orquestração centralizadas. As organizações podem usar o Distributed Cloud Network Connect com o Google Cloud NetApp Volumes , o NetApp Cloud Volumes ONTAP para Google Cloud e outros sistemas de armazenamento de dados da NetApp , fornecendo conectividade segura e desempenho rápido necessários para cargas de trabalho de IA.
A plataforma Vertex AI do Google Cloud completa a solução aproveitando esse acesso unificado aos dados para facilitar o RAG ao desenvolver applications LLM aumentados pelo contexto. A utilização eficiente de recursos da plataforma e a infraestrutura segura de IA ajudam as organizações a manter a relação custo-benefício enquanto dimensionam suas operações de IA.
Esta solução conjunta oferece diversas vantagens:
A F5, a NetApp e o Google Cloud se uniram para ajudar os clientes a implementar o RAG com segurança em ambientes híbridos e multinuvem.
As organizações podem aproveitar seus investimentos existentes na infraestrutura F5, NetApp e Google Cloud para criar uma solução RAG segura, tornando-a uma escolha prática para empresas que buscam aprimorar seus recursos de IA. A parceria permite que as organizações aproveitem seus dados para obter insights baseados em IA, mantendo a segurança e o controle. Ao simplificar o acesso a dados para applications RAG, as organizações podem se concentrar em derivar valor da IA em vez de gerenciar a complexidade da infraestrutura.
Os serviços de nuvem distribuída F5 estão disponíveis no Google Cloud Marketplace .