04/06/2026
4 Juin , 2026 read
Assistez à n’importe quelle conversation sur l’IA en entreprise en 2025 et l’énergie est palpable. Les preuves de concept sont partout. Les démonstrations sont soignées. L’enthousiasme est au rendez-vous. Demandez ensuite combien de ces pilotes tournent en production – traitant réellement de vraies décisions métier, à volume réel, avec une véritable responsabilité – et la salle se tait. Le rapport Tech Trends 2026 de Deloitte indique que seules 11 % des organisations ont des agents en production, alors que 38 % les pilotent ; 14 % font état de solutions prêtes au déploiement. Une enquête distincte de DigitalApplied suggère un univers de pilotes plus large, mais les chiffres de Deloitte constituent la source la plus solide concernant le fossé de la production. La fraction qui a atteint l’échelle dépasse à peine les dix pour cent.
C’est le fossé de l’adoption des agents, et ce n’est pas un problème technologique. Les modèles fonctionnent. Les démonstrations sont réelles. Ce qui ne fonctionne pas, c’est l’infrastructure organisationnelle, technique et de gouvernance nécessaire pour transformer un pilote prometteur en un système de production fiable. Cet article examine pourquoi — et ce que les organisations qui ont franchi ce fossé ont réellement fait différemment.
Le rapport State of AI in Business 2025 du MIT a documenté ce que les responsables technologiques des entreprises savent déjà intuitivement : 95 % des organisations étudiées n’ont constaté aucun retour mesurable de leurs initiatives d’IA générative, tandis que seuls 5 % des pilotes intégrés ont dégagé une valeur significative. Ce chiffre n’est pas une anomalie – c’est une condition structurelle. Une recherche distincte de S&P Global Market Intelligence montre que le taux d’abandon augmente fortement : la part des entreprises abandonnant la majorité de leurs initiatives d’IA est passée de 17 % à 42 %, l’organisation moyenne abandonnant 46 % de ses preuves de concept avant la production. Les chiffres sont frappants – et le schéma est suffisamment constant pour constituer un diagnostic.
Ce ne sont pas de mauvais projets. Beaucoup étaient techniquement solides. Ce qui leur manquait, c’est tout ce qui se situe entre une démonstration fonctionnelle et un système de production : l’intégration avec des données en direct, la supervision en temps réel, les protocoles de réponse aux incidents, la propriété organisationnelle et des structures de responsabilité qui survivent à la première défaillance.
Les chiffres sont frappants — et le schéma est suffisamment constant pour constituer un diagnostic.
L’enquête de DigitalApplied de mars 2026 auprès de 650 responsables technologiques d’entreprise identifie cinq lacunes fréquemment citées derrière les échecs de passage à l’échelle du pilote à la production. S’agissant d’une enquête publiée par un fournisseur plutôt que d’un référentiel académique ou d’analystes neutre, le chiffre exact de 89 % doit être considéré comme indicatif ; les cinq blocages eux-mêmes sont corroborés par des sources d’analystes plus solides telles que Gartner, Deloitte, McKinsey et S&P Global :
La projection de Gartner saisit la trajectoire : plus de 40 % des projets d’IA agentique seront annulés d’ici fin 2027 en raison de coûts croissants, d’une valeur métier incertaine ou de contrôles des risques inadéquats. Gartner note également que l’intégration des agents dans les systèmes existants peut être techniquement complexe et coûteuse, perturbant souvent les flux de travail. Et cela, avant même de prendre en compte les lacunes en matière de gouvernance, de talents et de supervision.
Le déficit de gouvernance est le blocage le plus sous-estimé. « Les organisations ne peuvent pas gouverner ce qu’elles ne voient pas » — et la recherche AI Trust OS de Bandara et al. (arXiv 2026) en documente la cause structurelle : les méthodologies de conformité conçues pour des logiciels déterministes « n’offrent aucun mécanisme pour découvrir ou valider en continu les systèmes d’IA qui émergent au sein des équipes d’ingénierie sans supervision formelle ».
Il en résulte un déficit de confiance qui se creuse à mesure que le déploiement s’étend. Le Connectivity Benchmark Report 2026 de Salesforce, relayé par UC Today, constate que 89 % des organisations déploient des agents d’IA dans la plupart ou la totalité de leurs équipes, mais que seules 54 % disposent d’un cadre de gouvernance formel pour ces déploiements. Par ailleurs, le rapport State of AI Agent Security 2026 de Gravitee révèle qu’en moyenne, seuls 47,1 % des agents d’IA d’une organisation sont activement supervisés ou sécurisés. Un agent qui traite des exceptions dans la réconciliation financière, prend des décisions de routage dans le service client ou signale des anomalies dans le contrôle de conformité opère, dans la plupart des entreprises, avec moins de supervision qu’un employé débutant en période d’essai.
Le cadre Agentic Risk & Capability (ARC) de Khoo et al. (2025) propose une taxonomie rigoureuse de ce qu’exige réellement la gouvernance d’entreprise des systèmes agentiques : évaluation systématique des capacités, classification des risques par type d’action et périmètre d’accès, et supervision continue par rapport à des référentiels opérationnels. La plupart des entreprises n’ont rien de tout cela. Un référentiel plus solide est le constat du State of AI in the Enterprise 2026 de Deloitte selon lequel seules 21 % des organisations interrogées déclarent un modèle de gouvernance mature pour l’IA agentique ; McKinsey constate de même qu’environ un tiers seulement des organisations atteignent le niveau de maturité trois ou plus en matière de gouvernance et de gouvernance de l’IA agentique.
Les limites des données figurent parmi les blocages les plus clairement validés au passage à l’échelle de l’IA agentique : McKinsey rapporte que huit entreprises sur dix citent les limites des données comme un obstacle à ce passage à l’échelle. L’agent n’est pas nécessairement défaillant – les données avec lesquelles il travaille le sont souvent. Les architectures de données existantes des entreprises ont été conçues pour le reporting par lots et des sorties lisibles par l’humain. Les agents ont besoin d’un accès à des données propres, structurées, en temps réel, avec des permissions, un versionnage et une traçabilité appropriés.
La recherche de Tagliabue et al. (arXiv 2025) sur les lakehouses agentiques dignes de confiance rend cela concret : « Même si les capacités de l’IA s’améliorent, la plupart des entreprises ne considèrent pas les agents comme suffisamment fiables pour travailler sur des données de production. » Le chemin vers la fiabilité en production commence par la résolution du problème d’infrastructure, pas du problème de modèle. Un agent fonctionnant sur une couche de données transactionnelle bien conçue, avec contrôles d’accès et pistes d’audit, devient gouvernable. Un agent accédant à des données d’entreprise non structurées via des intégrations ad hoc ne l’est pas.
C’est là que la plupart des pilotes sous-investissent. La démonstration utilise un jeu de données propre. La production hérite de vingt ans de schémas incohérents, de champs manquants et de formats hérités non documentés.
Les lacunes en compétences et en modèle opérationnel restent des obstacles centraux au passage à l’échelle des agents d’IA. Le défi n’est pas que les employés manquent d’aptitudes techniques. C’est que le déploiement d’un agent autonome dans un processus métier change la manière dont ce processus est détenu, supervisé et corrigé – et la plupart des organisations n’ont pas conçu cette transition.
L’analyse des pilotes d’IA ayant échoué menée par la Questrom School de l’Université de Boston conforte le diagnostic de conception organisationnelle : le fossé entre un pilote réussi et une mise en œuvre réussie est, fondamentalement, un fossé de responsabilité. Les pilotes échouent à l’échelle lorsque l’équipe qui a construit l’agent et l’équipe qui opère le processus concerné sont des groupes différents, avec des incitations différentes et sans structure de responsabilité partagée.
Les organisations qui ont réussi à franchir ce fossé ont créé des équipes dédiées aux opérations d’IA — non pas des équipes de développement d’IA, mais des équipes d’opérations — responsables de la supervision en production, de la maintenance des harnais d’évaluation, de la réponse aux incidents et des revues d’extension de périmètre. La distinction compte. Construire un agent et l’opérer en production ne sont pas le même métier.
Les organisations qui ont atteint l’échelle de la production partagent un schéma qui relève moins des choix technologiques que de la conception opérationnelle.
Elles ont traité la gouvernance comme une exigence préalable au déploiement, et non comme un audit a posteriori. Les structures de responsabilité, les tableaux de bord de supervision et les guides de réponse aux incidents ont été construits avant la mise en service de l’agent — et non ajoutés après la première défaillance.
Elles ont commencé par des processus à haute fréquence, à faibles enjeux et entièrement réversibles — tri des alertes, classification de documents, validation de données — où le coût des erreurs de l’agent était faible et la boucle de rétroaction pour l’amélioration rapide. Le déploiement d’observabilité agentique d’Adobe (Bharadwaj & Tu, arXiv 2026) l’illustre : commencer par le tri des alertes informatiques, un domaine où les défaillances sont visibles et corrigibles, avant d’étendre le périmètre.
Elles ont investi dans une infrastructure d’évaluation — des harnais de test systématiques capables de vérifier la qualité des sorties de l’agent par rapport aux distributions de données de production, et pas seulement aux scénarios pilotes. La qualité à grand volume n’est pas acquise ; c’est un livrable d’ingénierie qui exige sa propre infrastructure de test.
Et elles ont réalisé l’investissement dans les données en amont. Un accès à des données propres, structurées et gouvernées était un prérequis au déploiement, et non une tâche reportée à la « phase 2 ».
Le fossé de l’adoption des agents est un problème soluble, mais pas un problème technologique. De nombreux pilotes fonctionnent en conditions contrôlées. Le fossé est organisationnel : des cadres de gouvernance conçus pour des travailleurs humains appliqués à des agents autonomes, des architectures de données antérieures aux schémas d’accès qu’exigent les agents, et des approches de conduite du changement qui traitent le déploiement de l’IA comme un déploiement technique plutôt que comme une refonte opérationnelle.
Les entreprises qui combleront ce fossé au cours des 18 prochains mois n’y parviendront pas en trouvant de meilleurs modèles ou des fenêtres de contexte plus grandes. Elles y parviendront en construisant l’infrastructure de production — supervision, gouvernance, accès aux données et propriété opérationnelle — qui rend sûr le fonctionnement des agents à grande échelle.
La vraie question pour les dirigeants d’entreprise est de savoir si la stratégie d’IA de leur organisation inclut un modèle d’opérations de production, ou seulement une feuille de route de pilotes. L’un mène vers le petit groupe qui atteint la production. L’autre mène à une énième preuve de concept annulée.
Le point de vue de Novelis
Chez Novelis, nous travaillons directement avec les équipes d’entreprise qui naviguent à la frontière entre pilote et production. Les blocages décrits ici — déficits de gouvernance, maturité des données, fragmentation de la conduite du changement — sont ceux que nous rencontrons le plus régulièrement sur le terrain. Franchir ce fossé exige une méthodologie structurée, et pas seulement des compétences techniques. Si votre organisation se situe quelque part entre une démonstration impressionnante et un système de production fiable, c’est exactement le territoire sur lequel nous opérons.
Si les défis décrits ici font écho à la situation actuelle de votre organisation, nous sommes toujours ouverts à un échange. Les problèmes sont réels, les solutions évoluent vite, et les équipes qui les traversent ensemble vont généralement plus loin.