À mesure que les organisations adoptent de plus en plus de technologies d’IA, elles constatent qu’il peut être difficile de maintenir à jour les grands modèles linguistiques (LLM) avec leurs dernières données propriétaires. Cela a conduit à l’adoption de la génération augmentée de récupération (RAG), qui ajoute des données supplémentaires pour améliorer l’inférence de l’IA pour des réponses plus précises et plus utiles. Transférer ces données supplémentaires au LLM en toute sécurité peut s'avérer difficile, nécessitant une solution de connectivité sécurisée.
Les LLM traditionnels, bien que performants, se limitent à leurs données dʼentraînement et nʼont pas accès aux informations propres à votre organisation. RAG donne aux LLM la capacité d'interroger des sources externes lors de la génération, pour produire des résultats intégrant à la fois leurs connaissances étendues et les données exclusives de votre organisation.
Or, la majorité des organisations ont adopté des environnements multicloud et IT hybrides, ce qui disperse souvent leurs données sur plusieurs sources. Cette dispersion complique la mise en place efficace du RAG : vous devez assurer un accès sécurisé à toutes les sources pertinentes tout en conservant performance et maîtrise des coûts à grande échelle. Pour répondre à ce défi, il faut connecter en toute sécurité les magasins de données depuis toutes les sources vers les LLM. C’est pourquoi F5, NetApp et Google Cloud ont uni leurs forces pour vous offrir une solution.
Un flux de travail RAG de base qui comprend un récupérateur pour obtenir des données pertinentes à partir d'un grand modèle de langage, en les combinant avec le contexte nécessaire pour générer des informations précises et contextuellement pertinentes.
Les services cloud distribués F5 incluent une mise en réseau multicloud sécurisée pour connecter des applications et des données entre les clouds et les environnements sur site. En utilisant la dorsale privée du réseau mondial F5, F5 Distributed Cloud Network Connect fonctionne avec NetApp pour déplacer et stocker rapidement et en toute sécurité les données où et quand elles sont nécessaires.
Distributed Cloud Network Connect connecte spécifiquement le stockage NetApp, qu’il soit cloud ou sur site, aux LLM, y compris à la plateforme Vertex AI de Google Cloud, pour des inférences sécurisées, rapides et pertinentes. Nous offrons un cadre fluide facilitant l’accès aux sources de données réparties dans des environnements hybrides et multicloud.
Les capacités de mise en réseau multicloud sécurisées de F5 servent de base, permettant un accès efficace et protégé aux données dans différents environnements tout en maintenant une observabilité et une orchestration centralisées. Les organisations peuvent utiliser Distributed Cloud Network Connect avec Google Cloud NetApp Volumes , NetApp Cloud Volumes ONTAP pour Google Cloud et d'autres systèmes de stockage de données NetApp , offrant une connectivité sécurisée et des performances rapides nécessaires aux charges de travail de l'IA.
La plateforme Vertex AI de Google Cloud complète la solution en tirant parti de cet accès unifié aux données pour faciliter le RAG lors du développement d’applications LLM enrichies par le contexte. La plateforme optimise l’utilisation des ressources et offre une infrastructure d’IA sécurisée, vous aidant à maîtriser les coûts tout en développant vos opérations d’IA.
Cette solution commune présente plusieurs avantages :
F5, NetApp et Google Cloud se sont associés pour aider les clients à mettre en œuvre RAG en toute sécurité dans des environnements hybrides et multicloud.
Les organisations peuvent tirer parti de leurs investissements existants dans l’infrastructure F5, NetApp et Google Cloud pour créer une solution RAG sécurisée, ce qui en fait un choix pratique pour les entreprises cherchant à améliorer leurs capacités d’IA. Ce partenariat permet aux organisations d’exploiter leurs données pour obtenir des informations basées sur l’IA tout en maintenant la sécurité et le contrôle. En simplifiant l’accès aux données pour les applications RAG, les organisations peuvent se concentrer sur la valorisation de l’IA plutôt que sur la gestion de la complexité de l’infrastructure.
Les services cloud distribués F5 sont disponibles sur Google Cloud Marketplace .