BLOG

Acelerando la IA empresarial: Datos unificados para RAG con F5, NetApp y Google Cloud

Miniatura de Matthew Emes
Mateo Emes
Publicado el 4 de marzo de 2025

A medida que las organizaciones adoptan cada vez más tecnologías de IA, han descubierto que mantener los modelos de lenguaje grandes (LLM) actualizados con sus últimos datos patentados puede ser un desafío. Esto ha llevado a la adopción de la generación aumentada por recuperación (RAG), que agrega datos complementarios para mejorar la inferencia de IA para obtener respuestas más precisas y útiles. Obtener estos datos adicionales al LLM de forma segura puede resultar un desafío, por lo que se requiere una solución de conectividad segura.

La revolución de RAG en la IA empresarial

Los LLM tradicionales, si bien son potentes, están limitados por sus datos de capacitación y no pueden acceder a información específica de la organización. RAG permite a los LLM consultar fuentes de conocimiento externas durante la generación, produciendo resultados que reflejan tanto el conocimiento amplio del modelo como los datos exclusivos de una organización.

Sin embargo, como la mayoría de las organizaciones han migrado a entornos de TI híbridos y multicloud, sus datos suelen estar distribuidos en múltiples fuentes. Esta distribución dificulta la implementación efectiva de RAG, ya que las organizaciones deben garantizar un acceso seguro a todas las fuentes de datos relevantes y, al mismo tiempo, mantener el rendimiento y la rentabilidad a escala. Para resolver este desafío se necesita un medio para conectar de forma segura los almacenes de datos de todas las fuentes con LLM, por eso F5, NetApp y Google Cloud se han unido para ofrecer una solución. 

Un flujo de trabajo RAG básico que incluye un recuperador para obtener datos relevantes de un modelo de lenguaje grande, combinándolos con el contexto necesario para generar información precisa y contextualmente relevante.

Un enfoque unificado para el acceso a los datos

Los servicios de nube distribuida de F5 incluyen redes multicloud seguras para conectar aplicaciones y datos entre nubes y entornos locales. Al utilizar la red troncal privada de F5 Red Global, F5 Distributed Cloud Network Connect funciona con NetApp para mover y almacenar datos de forma rápida y segura dónde y cuándo se necesitan.

Específicamente para RAG, Distributed Cloud Network Connect vincula el almacenamiento de NetApp en la nube o en las instalaciones con LLM , incluida la plataforma Vertex AI de Google Cloud, para lograr una inferencia segura, rápida y relevante. Esta solución crea un marco perfecto para acceder a fuentes de datos distribuidas en entornos híbridos y multicloud.

Las capacidades de red multicloud segura de F5 sirven como base, permitiendo un acceso eficiente y protegido a los datos en diferentes entornos mientras se mantiene la observabilidad y la orquestación centralizadas. Las organizaciones pueden usar Distributed Cloud Network Connect con Google Cloud NetApp Volumes , NetApp Cloud Volumes ONTAP para Google Cloud y otros sistemas de almacenamiento de datos de NetApp , lo que proporciona la conectividad segura y el rendimiento rápido necesarios para las cargas de trabajo de IA.

La plataforma Vertex AI de Google Cloud completa la solución al aprovechar este acceso unificado a los datos para facilitar la RAG al desarrollar aplicações LLM aumentadas según el contexto. La utilización eficiente de los recursos de la plataforma y la infraestructura de IA segura ayudan a las organizaciones a mantener la rentabilidad mientras escalan sus operaciones de IA.

Esta solución conjunta ofrece varias ventajas:

  • Seguridad mejorada: Las redes multicloud de F5 tienen seguridad incorporada, incluidos firewalls de aplicação web, defensa contra bots y protección de API, así como una aplicación constante de políticas para defender datos patentados y modelos de IA, incluso en entornos híbridos complejos.
  • Redes cifradas: Las conexiones de capa 3 entre los modelos de IA y el almacenamiento de NetApp (tanto local como en la nube) están cifradas para proteger los datos confidenciales en tránsito.
  • Rendimiento optimizado: Con puntos de presencia en todo el mundo, la red global F5 minimiza la latencia y ofrece control sobre las velocidades de transferencia para aplicações de IA receptivas.
  • Operaciones multicloud simplificadas: Las organizaciones pueden administrar la seguridad y la red desde la nube hasta las instalaciones locales y el perímetro con F5 Distributed Cloud Console y dejar que Distributed Cloud Network Connect maneje las complejidades de la red multicloud.
  • Racionalización de herramientas: Reducir la cantidad de herramientas de seguridad y redes necesarias para soportar RAG e IA.

F5, NetApp y Google Cloud se han unido para ayudar a los clientes a implementar RAG de forma segura en entornos híbridos y multicloud.

Un camino simplificado hacia la productividad con IA

Las organizaciones pueden aprovechar sus inversiones existentes en la infraestructura de F5, NetApp y Google Cloud para crear una solución RAG segura, lo que la convierte en una opción práctica para las empresas que buscan mejorar sus capacidades de IA. La asociación permite a las organizaciones aprovechar sus datos para obtener información basada en inteligencia artificial y, al mismo tiempo, mantener la seguridad y el control. Al simplificar el acceso a los datos para las aplicações RAG, las organizaciones pueden centrarse en obtener valor de la IA en lugar de gestionar la complejidad de la infraestructura.

Los servicios de nube distribuida de F5 están disponibles en Google Cloud Marketplace .