BLOG

Acelerando a IA empresarial: Dados unificados para RAG com F5, NetApp e Google Cloud

Miniatura de Matthew Emes
Mateus Emes
Publicado em 04 de março de 2025

À medida que as organizações adotam cada vez mais tecnologias de IA, elas descobriram que manter grandes modelos de linguagem (LLMs) atualizados com seus dados proprietários mais recentes pode ser um desafio. Isso levou à adoção da geração aumentada de recuperação (RAG), que adiciona dados suplementares para aprimorar a inferência de IA para respostas mais precisas e úteis. Levar esses dados adicionais ao LLM com segurança pode ser desafiador, exigindo uma solução para conectividade segura.

A revolução RAG na IA empresarial

Os LLMs tradicionais, embora poderosos, são limitados por seus dados de treinamento e não conseguem acessar informações específicas da organização. O RAG permite que os LLMs consultem fontes de conhecimento externas durante a geração, produzindo saídas que refletem tanto o amplo conhecimento do modelo quanto os dados proprietários de uma organização.

No entanto, como a maioria das organizações migrou para ambientes de TI híbridos e multinuvem, seus dados geralmente estão espalhados por diversas fontes. Essa distribuição dificulta a implementação eficaz do RAG, pois as organizações devem garantir acesso seguro a todas as fontes de dados relevantes, mantendo o desempenho e a eficiência de custos em escala. Resolver esse desafio requer um meio de conectar com segurança os armazenamentos de dados em todas as fontes com LLMs, e é por isso que a F5, a NetApp e o Google Cloud se uniram para oferecer uma solução. 

Um fluxo de trabalho RAG básico que inclui um recuperador para obter dados relevantes de um grande modelo de linguagem, combinando-os com o contexto necessário para gerar informações precisas e contextualmente relevantes.

Uma abordagem unificada para acesso a dados

Os Serviços de Nuvem Distribuída da F5 incluem redes multinuvem seguras para conectar aplicativos e dados entre nuvens e ambientes locais. Usando o backbone privado da F5 Rede Global, o F5 Distributed Cloud Network Connect trabalha com a NetApp para mover e armazenar dados de forma rápida e segura onde e quando for necessário.

Especificamente para o RAG, o Distributed Cloud Network Connect conecta o armazenamento NetApp na nuvem ou no local aos LLMs , incluindo a plataforma Vertex AI do Google Cloud, para inferência segura, rápida e relevante. Esta solução cria uma estrutura perfeita para acessar fontes de dados distribuídas em ambientes híbridos e multinuvem.

Os recursos de rede multicloud segura da F5 servem como base, permitindo acesso eficiente e protegido a dados em diferentes ambientes, mantendo a observabilidade e a orquestração centralizadas. As organizações podem usar o Distributed Cloud Network Connect com o Google Cloud NetApp Volumes , o NetApp Cloud Volumes ONTAP para Google Cloud e outros sistemas de armazenamento de dados da NetApp , fornecendo conectividade segura e desempenho rápido necessários para cargas de trabalho de IA.

A plataforma Vertex AI do Google Cloud completa a solução aproveitando esse acesso unificado aos dados para facilitar o RAG ao desenvolver applications LLM aumentados pelo contexto. A utilização eficiente de recursos da plataforma e a infraestrutura segura de IA ajudam as organizações a manter a relação custo-benefício enquanto dimensionam suas operações de IA.

Esta solução conjunta oferece diversas vantagens:

  • Segurança aprimorada: A rede multicloud da F5 tem segurança integrada, incluindo firewalls de application da web, defesa de bots e proteção de API, bem como aplicação consistente de políticas para defender dados proprietários e modelos de IA, mesmo em ambientes híbridos complexos.
  • Rede criptografada: As conexões da camada 3 entre os modelos de IA e o armazenamento NetApp (tanto no local quanto na nuvem) são criptografadas para proteger dados confidenciais em trânsito.
  • Desempenho otimizado: Com pontos de presença ao redor do mundo, a F5 Rede Global minimiza a latência e oferece controle sobre as velocidades de transferência para applications de IA responsivos.
  • Operações multicloud simplificadas: As organizações podem gerenciar a segurança e a rede da nuvem para o local e a borda com o F5 Distributed Cloud Console e deixar o Distributed Cloud Network Connect lidar com as complexidades da rede multicloud.
  • Racionalização de ferramentas: Reduza o número de ferramentas de segurança e rede necessárias para dar suporte a RAG e IA.

A F5, a NetApp e o Google Cloud se uniram para ajudar os clientes a implementar o RAG com segurança em ambientes híbridos e multinuvem.

Um caminho simplificado para a produtividade da IA

As organizações podem aproveitar seus investimentos existentes na infraestrutura F5, NetApp e Google Cloud para criar uma solução RAG segura, tornando-a uma escolha prática para empresas que buscam aprimorar seus recursos de IA. A parceria permite que as organizações aproveitem seus dados para obter insights baseados em IA, mantendo a segurança e o controle. Ao simplificar o acesso a dados para applications RAG, as organizações podem se concentrar em derivar valor da IA ​​em vez de gerenciar a complexidade da infraestrutura.

Os serviços de nuvem distribuída F5 estão disponíveis no Google Cloud Marketplace .