BLOG

GPU en tant que service : Le catalyseur de la croissance de l’IA dans l’ASEAN, les opportunités et les défis

Chin Keng Lim Miniature
Chin Keng Lim
Publié le 14 octobre 2024

À mesure que l’intelligence artificielle (IA) continue de progresser, la demande en matériel hautes performances monte en flèche. Les organisations ont de plus en plus de mal à suivre le rythme de la puissance de calcul requise pour exécuter des modèles et des charges de travail d’IA complexes. C'est là qu'intervient le GPU en tant que service (GPUaaS).

En offrant un accès à la demande à de puissantes unités de traitement graphique (GPU) sur le cloud, GPUaaS transforme la façon dont les entreprises abordent l'infrastructure de l'IA. Il élimine le besoin d’investissements matériels coûteux, permet une mise à l’échelle transparente et s’intègre parfaitement aux services cloud existants, tout en simplifiant les opérations. Mais comment fonctionne exactement le GPUaaS et pourquoi devient-il la solution incontournable pour les organisations axées sur l’IA ?

Libérer le potentiel de l’IA dans l’ASEAN

Au sein de l’Association des nations de l’Asie du Sud-Est (ASEAN), le marché du GPUaaS se développe à mesure que de plus en plus d’acteurs entrent dans l’espace pour relever des défis régionaux spécifiques. L’un des facteurs clés de cette croissance est la langue. Les grands modèles linguistiques open source (LLM) sont principalement formés en anglais et ont souvent du mal à maîtriser les langues locales riches en nuances culturelles. Par conséquent, les organisations doivent recycler ou affiner ces modèles avec des données locales pour garantir des réponses plus précises et plus pertinentes dans les langues maternelles.

Dans le même temps, les avantages liés à l’utilisation du GPUaaS contribuent à alimenter son adoption. L'évolutivité permet aux utilisateurs d'ajuster sans effort les ressources GPU en fonction des besoins du projet. Alors que l’élasticité, grâce à un modèle de paiement à l’utilisation, permet aux organisations de réduire leurs dépenses globales en payant uniquement pour ce qu’elles utilisent. GPUaaS offre également un accès immédiat à une technologie de pointe, facilitant le prototypage et le déploiement rapides qui augmentent la flexibilité et réduisent les délais de mise sur le marché.

Une autre considération importante est la gravité, la résidence et la souveraineté des données. La gravité des données fait référence à la tendance des données à attirer des applications et des services vers leur emplacement pour de meilleures performances et une meilleure efficacité. Dans de nombreux cas, les données doivent résider dans des emplacements spécifiques en raison des réglementations de résidence et de souveraineté, ce qui signifie que les fournisseurs de GPUaaS doivent être situés à proximité de leurs bases d'utilisateurs. L'IA souveraine, qui met l'accent sur la capacité d'une nation à développer l'IA en utilisant sa propre infrastructure, ses propres données et ses propres ressources, joue également un rôle important dans la définition de la demande de GPUaaS localisé.

Enfin, le coût et l’offre limitée de GPU au sein des fournisseurs de services cloud (CSP) de l’ASEAN sont des facteurs à prendre en compte lorsqu’il s’agit d’adopter le GPUaaS. Selon un récent rapport Dell , les déploiements d’IA sur site peuvent générer jusqu’à 75 % d’économies par rapport aux solutions basées sur CSP. GPUaaS offre une alternative rentable, permettant aux organisations d'accéder à des GPU hautes performances sans investir au préalable dans une quantité importante de matériel, ce qui en fait une option attrayante pour ceux qui cherchent à faire évoluer leurs capacités d'IA dans la région.

Équilibrer les avantages et les risques du GPUaaS

Bien que les avantages du GPUaaS contribuent à son adoption généralisée, ils apportent également leur lot de préoccupations. L’un des principaux problèmes est la sécurité des données, car les données transmises vers et depuis les GPU peuvent être vulnérables à l’interception ou à l’accès non autorisé. De plus, le traitement des données sur des GPU distants peut impliquer de se conformer à différentes réglementations en matière de protection des données et à différentes exigences de conformité. Une autre préoccupation concerne les performances, où la dépendance à Internet ou à la connectivité privée et les performances fluctuantes du GPU peuvent affecter la vitesse et la réactivité des applications. Le GPUaaS dépend de connexions stables et à haut débit, privilégiant souvent les réseaux privés par rapport à l'Internet public pour des performances optimales.

Comment F5 aide-t-il ?

F5 propose des services innovants de mise en réseau, d'optimisation du trafic et de sécurité basés sur SaaS multicloud pour les clouds publics et privés, y compris les fournisseurs de GPUaaS, via une console unique.

En formant une superposition de maillage crypté au-dessus de n'importe quel réseau, les organisations peuvent se connecter à un fournisseur GPUaaS (usine d'IA) pour l'inférence, l'intégration ou la formation de l'IA. Grâce à une segmentation complète du réseau et des applications, toute la connectivité superposée est privée et sécurisée, construite sur une sous-couche réseau existante. De plus, la structure maillée cryptée F5 répond aux défis de la résilience numérique en surveillant, détectant, optimisant et distribuant de manière dynamique le trafic vers ces composants d'IA sains, garantissant ainsi que vos applications d'IA sont toujours opérationnelles et disponibles.

Vous trouverez ci-dessous un exemple de déploiement de génération augmentée de récupération LLM (RAG), exploitant une usine d'IA d'un fournisseur GPUaaS. Les données étant transportées en toute sécurité via le maillage sécurisé grâce au cryptage, il n'y a aucune inquiétude concernant les données en transit ; il n'y a pas non plus de données au repos chez le fournisseur GPUaaS. Les données du corpus d’une organisation au repos restent à l’emplacement d’origine sans aucune modification. Cette architecture permet également l’inférence de l’IA pour les applications sensibles à la latence en périphérie (un cloud public ou même des succursales).

Si l'application d'IA (comme un chatbot agentique compatible RAG) est rendue accessible depuis Internet, il est important d'envisager un service de protection d'application Web et d'API (WAAP) basé sur un réseau cloud pour protéger l'application d'IA contre les cyberattaques.

Figure 1 : Un exemple de déploiement d'une génération augmentée de récupération LLM (RAG), exploitant une usine d'IA d'un fournisseur GPUaaS
Figure 1 : Un exemple de déploiement d'une génération augmentée de récupération LLM (RAG), exploitant une usine d'IA d'un fournisseur GPUaaS

En exploitant une plateforme avec une console de gestion unique, il est désormais possible d'assurer la conformité, l'observabilité et le contrôle de tout le trafic, y compris les API traversant le nord/sud et l'est/ouest à travers la structure maillée cryptée.

Figure 2 : La découverte d'API, la gestion des postures et la protection des API sont fondamentales pour la sécurité de l'IA LLM.
Figure 2 : La découverte d'API, la gestion des postures et la protection des API sont fondamentales pour la sécurité de l'IA LLM.

De plus, le trafic sur l’Internet public et le maillage crypté privé doit être observable et contrôlable par les équipes NetOps et SecOps pour gérer ce qui est essentiellement une infrastructure multicloud complexe et hétérogène.

Figure 3 : La mise en réseau multicloud et l'observabilité sont essentielles dans un déploiement d'IA distribuée, qui peut s'étendre sur des centres de données sur site, un cloud privé, un cloud public et un périphérique.
Figure 3 : La mise en réseau multicloud et l'observabilité sont essentielles dans un déploiement d'IA distribuée, qui peut s'étendre sur des centres de données sur site, un cloud privé, un cloud public et un périphérique.

Vous souhaitez en savoir plus ?

À mesure que l’adoption de l’IA s’accélère, il est essentiel de renforcer la résilience des systèmes d’IA pour garantir un succès à long terme. GPUaaS offre une solution évolutive et efficace, mais les organisations doivent relever des défis tels que la sécurité des données, la variabilité des performances et la conformité réglementaire. En répondant à ces préoccupations et en tirant parti de la flexibilité du GPUaaS, les entreprises peuvent mieux se positionner pour répondre aux demandes croissantes des charges de travail pilotées par l’IA.

Si vous souhaitez découvrir comment la résilience de l'IA peut autonomiser votre organisation, venez nous rendre visite lors de la prochaine conférence GovWare au stand P06, du 15 au 17 octobre, au Sands Expo and Convention Centre, où nous discuterons plus en détail de ces tendances et solutions.