BLOG | BUREAU DU CTO

Maîtriser les applications d'IA générative via leur contexte

Vignette de James Hendergart
James Hendergart
Publié le 13 octobre 2025

La récente enquête AI Pulse menée par EY révèle que 87 % des cadres supérieurs rencontrent des obstacles à l'adoption, couvrant des enjeux de cybersécurité, de données, ainsi que l'absence de politique et de gouvernance. Pour intégrer l’IA générative (GenAI) dans votre entreprise, vous devez non seulement le souhaiter, mais aussi être capable de le réaliser. La différence entre ces deux facteurs se traduit par une complexité opérationnelle et un besoin accru de confiance envers cette technologie émergente.

Les entreprises développent et déploient des logiciels depuis des décennies, mais GenAI impose un nouveau défi : celui du contrôle. À la différence des logiciels traditionnels, les applications GenAI agissent de manière autonome et imprévisible. Vous ne pouvez donc pas leur faire confiance pour n’effectuer que ce qui est prévu, sans jamais agir autrement—du moins pas encore. L'absence de contrôle freine l’adoption à grande échelle. En saisissant le rôle central du contexte, vous comprenez mieux ce défi, et c’est ainsi que vous pouvez étendre la conception logicielle traditionnelle pour intégrer GenAI.

Avec un contexte suffisant, vous pouvez maîtriser l’incertitude des applications GenAI, car le contexte relie ce que ces applications peuvent accomplir aux objectifs de votre entreprise. Vous pouvez puiser le contexte dans trois domaines : l’application GenAI, l’environnement et l’entreprise.

Comparaison du contexte d’application

Le contexte disponible dans les applications GenAI diffère grandement de celui des applications traditionnelles. Les applications traditionnelles définissent à l’avance les entrées autorisées comme paramètres pour des opérations prédéfinies. Les mêmes entrées génèrent toujours les mêmes résultats. En revanche, les applications GenAI accueillent une gamme bien plus large d’entrées dans leurs grands modèles de langage (LLM), dont les résultats sont, par nature, non déterministes. Les mêmes entrées peuvent donc produire ou non les mêmes résultats.

Exemple de déterminisme applicatif traditionnel :

Ce script Python calcule l’âge d’une personne à partir de sa date de naissance et de la date actuelle. Par souci de concision, il ne prend pas en compte la gestion des types ni le fait que l’anniversaire peut déjà être passé cette année.

from datetime import datetime

from typing import Union

def calculate_age(date_naissance :str, date_courante :str) -> int

age = current_dt.year - birth_dt.year

renvoyer l'âge

Date de naissance : 30 juin 1972, date du jour : 31 août 2025

Âge : 53 ans.  

Exemple de non-déterminisme dans une application GenAI :

Cette application suggère l'âge probable d'une personne en se basant sur des informations générales, sans avoir besoin de connaître sa date de naissance ni la date du jour.

Classement CASI

Les applications d’IA générative traitent une large gamme d’entrées pour l’inférence par LLM.

Question : Quel âge a une personne qui aime la musique disco et se rappelle qui a remporté l’or Olympique au 100 m féminin à Barcelone ?

Après avoir soumis ce prompt précis trois fois, voici les réponses générées par le LLM :

Réponse 1 : 55 ans

Réponse 2 : 40 à 60 ans

Réponse 3 : 40, 50 ou 60 secondes

La fonction Python intégrée à l’application traditionnelle reçoit deux données en entrée (date de naissance et date actuelle) et calcule l’écart en années. Elle ne peut pas déterminer l’âge exact d’une personne ni intégrer des descriptions de ses préférences, habitudes, etc., car elle n’est pas capable de synthétiser ni de tirer de conclusions.

En comparaison, l’application GenAI peut analyser des affirmations sur les genres musicaux populaires durant l’enfance et des connaissances générales sur les grands événements sportifs pour formuler une réponse, mais celles-ci varient car de petits changements dans l’entrée, comme la reformulation d’une question ou les réglages de température (qui influencent le degré d’aléa dans les réponses du LLM), modifient les résultats. Même si le code de l’application reste le même entre les réponses, celles-ci peuvent différer. Ces variations augmentent avec la complexité de la requête, l’ajout de sources d’entrée, et le comportement des composants de routage dans l’infrastructure d’inférence.

Avec cette marge de manœuvre, vous pouvez facilement imaginer des cas où une application GenAI s’écarte profondément de son comportement prévu sans contexte supplémentaire. Ces deux exemples montrent à quel point le logiciel traditionnel est déterministe, alors que les applications GenAI sont non déterministes. Le logiciel traditionnel ne cherche pas à deviner ou à prédire l’âge d’une personne en se basant sur le contexte, mais vous attendez des applications GenAI qu’elles traitent régulièrement ce genre de questions non déterministes. Si l’application ne dispose pas de suffisamment de contexte, il faut alors analyser l’environnement de l’application.

Le contexte environnemental informe l’application depuis l’extérieur

L’environnement inclut l’infrastructure et les services autour de l’application. En juillet 1982, lors du séminaire CreativeThink dans l’industrie informatique, Alan Kay affirmait : « Ceux qui prennent vraiment le logiciel au sérieux devraient créer leur propre matériel », convaincu du lien étroit entre les deux. Je souhaite étendre cette idée pour englober aussi l’environnement de déploiement.

Les applications ne fonctionnent pas isolément. De nombreux services d’infrastructure s’associent pour offrir un environnement d’exécution aux applications. Ces services restent externes aux applications tout en étant indispensables à leur bon fonctionnement, tout comme le matériel. En approfondissant cette idée, nous surveillons rigoureusement ces services d’infrastructure grâce à diverses solutions d’observabilité qui collectent et suivent des données de télémétrie détaillées au fil du temps. Ces données montrent comment l’application fonctionne et comment son environnement peut l’influencer.

Le contexte environnemental se divise en deux types : passif et actif. Toutes les formes de télémétrie (journaux, métriques, traces, événements) sont passives puisqu’elles sont continuellement émises et collectées pendant que l’infrastructure et les applications fonctionnent. Les alertes, notifications et tableaux de bord relèvent de l’actif. Nous utilisons des règles pour interpréter la télémétrie et transmettre le contexte opérationnel. L’ajustement des règles confère un sens opérationnel aux informations, en évaluant quand les tolérances partout dans l’environnement sont atteintes ou dépassées.

Les applications GenAI bousculent l’approche fondée sur les règles parce que la télémétrie fiable capable de couvrir les comportements apparemment infinis d’un composant autonome n’existe pas encore. Cela ne signifie pas que l’innovation s’est arrêtée. Nous expérimentons deux pistes : Des métriques basées sur le domaine pour évaluer le succès de GenAI et le recours à un LLM en tant que juge. La première recourt à des méthodes alternatives pour établir une vérité de référence puis comparer les résultats de GenAI, en notant les taux de succès et d’échec. La seconde emploie un LLM pour évaluer la précision d’un autre. Le temps nous dira jusqu’où ces approches divergentes réussiront à obtenir un contrôle réel de GenAI à partir du contexte environnemental.

L'intention commerciale achève le tableau contextuel

L’intention commerciale correspond à l’expression « Tout ce que l’entreprise souhaite, rien de ce qu’elle ne veut pas. » Elle englobe les situations que l’application et l’environnement pourraient ne pas détecter.

Des actualités récentes soulignent un cas où le composant GenAI d’une application disposait de suffisamment de pouvoir pour exécuter des opérations extrêmement préjudiciables, comme supprimer tous les dossiers clients d’une base de données. Voici quelques éléments issus de cette situation qui illustrent le décalage entre l’objectif commercial et les actions possibles des applications GenAI.

Que s’est-il passé Le contexte métier absent
Un outil de codage IA a supprimé une base de données de production pendant un gel du code.
  • Vous ne devez rien modifier pendant un gel du code source, même si un composant le permet.
  • L'outil de codage IA doit toujours s'interrompre pour vous demander la permission avant d'exécuter des actions sensibles, comme supprimer une base de données entière ou modifier quoi que ce soit durant un gel de code. Aucune action sensible ne doit être prise sans votre approbation humaine.
L'outil de codage IA a indiqué que les retours en arrière de base de données n'étaient pas pris en charge et qu'aucune instance n'était disponible pour la restauration, mais vous pouviez en fait effectuer manuellement un retour en arrière avec succès.
  • L’outil de codage IA ne doit jamais tromper.
  • L'outil de codage IA ne doit jamais fournir de fausses informations sur l'état ou la capacité à réaliser des tâches opérationnelles critiques comme la sauvegarde et le retour arrière.

Cette étude de cas met en lumière certains des écarts possibles entre ce que GenAI peut être autorisé à faire et les objectifs réels d'une entreprise.

Concevoir une application avec une fonction pour supprimer un enregistrement est tout à fait logique, mais laisser l’IA supprimer tous les enregistrements sans demander d’autorisation ne l’est pas. Dans les logiciels traditionnels, on limite les droits de suppression pour réduire le risque de pertes, mais GenAI apporte une autonomie que les contrôles d’accès basés sur les rôles ne maîtrisent pas suffisamment. Le contexte métier apporte une aide en distinguant les comportements attendus de ceux qui ne le sont pas, et en traduisant cela en exigences précises, incluant les actions strictement interdites et les pauses nécessaires pour une intervention humaine. C’est l’ensemble du contexte qui permet d’exercer un tel degré de contrôle.

Les architectures applicatives conçues avant l’arrivée de GenAI ne répondent plus aux besoins actuels. GenAI impose un nouveau modèle architectural intégrant les trois domaines de contexte : l’application, son environnement, et l’intention métier. Cette explication de Phil Schmid, ingénieur principal en relation IA chez Google DeepMind, vous aidera particulièrement à comprendre l’importance cruciale des applications GenAI. Il montre que les LLM reçoivent le contexte comme partie intégrante de leurs données d’entrée, et illustre comment différents composants des applications GenAI ont chacun leur propre définition et utilisation du contexte.

L’architecture et l’ingénierie des applications GenAI doivent intégrer les trois domaines de contexte pour garantir des résultats toujours alignés avec les objectifs métier. Sans une vision contextuelle complète, le contrôle est illusoire, la confiance disparaît, et l’adoption à grande échelle devient impossible.