BLOG | BUREAU DU CTO

L'IA générative et les types de données émergents ont un impact sur l'architecture des applications

Miniature de Lori MacVittie
Lori MacVittie
Publié le 2 avril 2024

En 2022, j’ai remarqué un changement subtil dans l’architecture des applications qui s’est manifesté sur le marché avec des discussions autour de nouveaux protocoles et données. Cela n’était pas si surprenant, car comme je l’ai mentionné à l’époque, les architectures d’applications augmentent historiquement et commencent à façonner les marchés de la distribution et de la sécurité des applications tous les cinq ans, et deviennent dominantes environ cinq ans plus tard.

En 2023, je pensais que ce changement se ferait sentir vers 2025. Mais je ne pouvais pas prévoir l’arrivée de l’IA générative, et son effet explosif sur l’évolution de ces architectures.

Tout cela pour dire que ce changement se produit plus rapidement et va avoir un effet dramatique sur, eh bien, tout.

Mais pour ne pas nous laisser emporter par l’évolution architecturale, nous devrions vraiment comprendre ce qui la motive : les données. 

Différents types de données

En général, lorsque l’on parle de « données », l’auditeur évoque immédiatement des images de lignes de données clients et produits stockées quelque part dans un SGBDR massif. D’accord, peut-être pas tous les auditeurs, mais beaucoup le font. C’est parce que la conception dominante du stockage de données s’oriente vers des données structurées et tabulaires. Ouvrez une feuille de calcul et vous verrez ce que je veux dire. Il est basé sur des lignes et des colonnes, et un SGBDR n’est pas vraiment différent.

Nous pourrions affirmer que les magasins de données NoSQL et clé-valeur, les magasins d'objets et les constructions de données similaires existent et que, par conséquent, les architectures d'applications ne tournent pas autour de données tabulaires. Mais allez, ils le font vraiment. Tous ces autres types de magasins de données sont utilisés et exploités pour de bonnes raisons, mais la plupart de ces raisons étaient accessoires à l’application et n’ont donc pas modifié de manière significative les principes architecturaux globaux qui ont guidé la construction de l’application pendant des décennies.

Mais la distribution croissante des applications – et les modèles hybrides – génèrent de nombreux besoins. Comme l’observabilité et la sécurité, qui exigent la génération de données de télémétrie . La distribution nécessite un moyen de comprendre les relations entre les magasins de données distribués, ce qui conduit à des graphiques de connaissances. L’IA générative exige des moyens d’augmenter et de former les modèles, ce qui conduit à l’utilisation d’intégrations stockées dans des bases de données vectorielles.

Il s’agit de quatre types de données très différents, accompagnés de nouvelles façons de les stocker et d’y accéder. Ces quatre éléments deviennent rapidement des « composants standards » d’une application moderne, en particulier ceux qui sont conçus pour faciliter l’utilisation de l’IA générative. 

Chiffre: Une vue de base et de haut niveau d'une application moderne basée sur l'IA
  1. La télémétrie entraîne des changements importants dans le domaine des opérations, car nous comprenons que les formats en colonnes sont un meilleur moyen de transférer et de traiter les données en streaming en temps réel, ce que sont réellement les données de télémétrie.
  2. Les graphiques de connaissances et la technologie graphique permettent de fédérer les données distribuées et de comprendre les relations complexes entre les sources de données. Cette technologie nous apporte des protocoles comme GraphQL qui modifient radicalement la façon dont nous exploitons les API pour rechercher et gérer les données dans l’ensemble de l’entreprise distribuée.
  3. L'adoption croissante des techniques de génération augmentée de récupération (RAG) pour l'IA générative fait des bases de données vectorielles une partie de l'application elle-même, plutôt qu'un magasin de données situé plus en profondeur dans l'architecture.
  4. Et enfin, n’oublions pas les données de l’IA générative. Un LLM génère de nouvelles données à chaque fois que vous faites une demande. Cela pose des défis importants aux professionnels de la sécurité, qui doivent déterminer comment identifier les menaces et les problèmes potentiels au sein des données non structurées générées dynamiquement .

Ce sont les données, avec leurs différents formats, protocoles, utilisations et applications, qui sont à l’origine de ce changement. Le résultat est une approche headless qui s’appuie sur des API d’une manière que beaucoup de gens n’ont jamais envisagée auparavant. Autrement dit, les capacités et fonctions commerciales sont exposées sous forme d’API sans tenir compte de la couche de présentation traditionnelle, ce qui permet de développer une plus grande gamme d’interfaces pour un ensemble plus robuste d’appareils utilisateur. Les API rendent les données et les fonctionnalités accessibles , c'est pourquoi elles sont si importantes pour la transformation numérique

Nous voyons cette approche dans de nombreuses applications modernes qui tirent parti des microservices. C’est la raison pour laquelle les frameworks d’interface utilisateur sont si répandus (et suscitent des débats sur Internet). Ces frameworks sont utilisés pour créer des applications individuelles qui exploitent les API pour accéder aux fonctionnalités et aux données. Il s’agit d’entités distinctes des « applications » back-end qu’elles utilisent pour piloter les flux de travail et apporter de la valeur au marché.

Tout cela conduit à des architectures sans tête. Le changement était déjà en cours, mais l’arrivée de l’IA générative a mis en lumière la criticité des données et l’a accéléré.

Cela aura à son tour un impact profond sur la distribution et la sécurité des applications à mesure que de nouvelles menaces et de nouveaux défis surgissent et doivent être traités pour satisfaire les besoins des entreprises et des utilisateurs.