Le fossé de l’adoption des agents : pourquoi les entreprises pilotent tout et ne déploient rien

04/06/2026

4 Juin , 2026 read

Assistez à n’importe quelle conversation sur l’IA en entreprise en 2025 et l’énergie est palpable. Les preuves de concept sont partout. Les démonstrations sont soignées. L’enthousiasme est au rendez-vous. Demandez ensuite combien de ces pilotes tournent en production – traitant réellement de vraies décisions métier, à volume réel, avec une véritable responsabilité – et la salle se tait. Le rapport Tech Trends 2026 de Deloitte indique que seules 11 % des organisations ont des agents en production, alors que 38 % les pilotent ; 14 % font état de solutions prêtes au déploiement. Une enquête distincte de DigitalApplied suggère un univers de pilotes plus large, mais les chiffres de Deloitte constituent la source la plus solide concernant le fossé de la production. La fraction qui a atteint l’échelle dépasse à peine les dix pour cent.

C’est le fossé de l’adoption des agents, et ce n’est pas un problème technologique. Les modèles fonctionnent. Les démonstrations sont réelles. Ce qui ne fonctionne pas, c’est l’infrastructure organisationnelle, technique et de gouvernance nécessaire pour transformer un pilote prometteur en un système de production fiable. Cet article examine pourquoi — et ce que les organisations qui ont franchi ce fossé ont réellement fait différemment.

1. Le chiffre de 95 % qui revient sans cesse

Le rapport State of AI in Business 2025 du MIT a documenté ce que les responsables technologiques des entreprises savent déjà intuitivement : 95 % des organisations étudiées n’ont constaté aucun retour mesurable de leurs initiatives d’IA générative, tandis que seuls 5 % des pilotes intégrés ont dégagé une valeur significative. Ce chiffre n’est pas une anomalie – c’est une condition structurelle. Une recherche distincte de S&P Global Market Intelligence montre que le taux d’abandon augmente fortement : la part des entreprises abandonnant la majorité de leurs initiatives d’IA est passée de 17 % à 42 %, l’organisation moyenne abandonnant 46 % de ses preuves de concept avant la production. Les chiffres sont frappants – et le schéma est suffisamment constant pour constituer un diagnostic.

Ce ne sont pas de mauvais projets. Beaucoup étaient techniquement solides. Ce qui leur manquait, c’est tout ce qui se situe entre une démonstration fonctionnelle et un système de production : l’intégration avec des données en direct, la supervision en temps réel, les protocoles de réponse aux incidents, la propriété organisationnelle et des structures de responsabilité qui survivent à la première défaillance.

Les chiffres sont frappants — et le schéma est suffisamment constant pour constituer un diagnostic.

2. Les cinq blocages récurrents derrière les déploiements au point mort

L’enquête de DigitalApplied de mars 2026 auprès de 650 responsables technologiques d’entreprise identifie cinq lacunes fréquemment citées derrière les échecs de passage à l’échelle du pilote à la production. S’agissant d’une enquête publiée par un fournisseur plutôt que d’un référentiel académique ou d’analystes neutre, le chiffre exact de 89 % doit être considéré comme indicatif ; les cinq blocages eux-mêmes sont corroborés par des sources d’analystes plus solides telles que Gartner, Deloitte, McKinsey et S&P Global :

  • Incompatibilité des systèmes existants — les API et architectures de données existantes des entreprises ont été conçues pour des schémas d’interaction prédéfinis, pilotés par l’humain, et sont structurellement inadaptées aux schémas d’accès dynamiques et orientés objectifs des agents d’IA
  • Qualité de sortie irrégulière à grand volume — les agents performants dans des pilotes contrôlés présentent une dégradation lorsqu’ils traitent des milliers de décisions par jour sur des données réelles variables
  • Absence d’outils de supervision — aucune infrastructure pour détecter quand un agent dérive, échoue silencieusement ou produit des résultats nécessitant une revue humaine
  • Propriété organisationnelle floue — aucune équipe unique responsable du comportement de l’agent en production, ce qui signifie que les problèmes apparaissent dans des incidents opérationnels plutôt que dans des tableaux de bord de supervision
  • Données d’entraînement métier insuffisantes — le décalage de distribution entre les scénarios pilotes et les cas limites de production dépasse ce sur quoi l’agent a été testé

La projection de Gartner saisit la trajectoire : plus de 40 % des projets d’IA agentique seront annulés d’ici fin 2027 en raison de coûts croissants, d’une valeur métier incertaine ou de contrôles des risques inadéquats. Gartner note également que l’intégration des agents dans les systèmes existants peut être techniquement complexe et coûteuse, perturbant souvent les flux de travail. Et cela, avant même de prendre en compte les lacunes en matière de gouvernance, de talents et de supervision.

3. La déconnexion structurelle de la gouvernance

Le déficit de gouvernance est le blocage le plus sous-estimé. « Les organisations ne peuvent pas gouverner ce qu’elles ne voient pas » — et la recherche AI Trust OS de Bandara et al. (arXiv 2026) en documente la cause structurelle : les méthodologies de conformité conçues pour des logiciels déterministes « n’offrent aucun mécanisme pour découvrir ou valider en continu les systèmes d’IA qui émergent au sein des équipes d’ingénierie sans supervision formelle ».

Il en résulte un déficit de confiance qui se creuse à mesure que le déploiement s’étend. Le Connectivity Benchmark Report 2026 de Salesforce, relayé par UC Today, constate que 89 % des organisations déploient des agents d’IA dans la plupart ou la totalité de leurs équipes, mais que seules 54 % disposent d’un cadre de gouvernance formel pour ces déploiements. Par ailleurs, le rapport State of AI Agent Security 2026 de Gravitee révèle qu’en moyenne, seuls 47,1 % des agents d’IA d’une organisation sont activement supervisés ou sécurisés. Un agent qui traite des exceptions dans la réconciliation financière, prend des décisions de routage dans le service client ou signale des anomalies dans le contrôle de conformité opère, dans la plupart des entreprises, avec moins de supervision qu’un employé débutant en période d’essai.

Le cadre Agentic Risk & Capability (ARC) de Khoo et al. (2025) propose une taxonomie rigoureuse de ce qu’exige réellement la gouvernance d’entreprise des systèmes agentiques : évaluation systématique des capacités, classification des risques par type d’action et périmètre d’accès, et supervision continue par rapport à des référentiels opérationnels. La plupart des entreprises n’ont rien de tout cela. Un référentiel plus solide est le constat du State of AI in the Enterprise 2026 de Deloitte selon lequel seules 21 % des organisations interrogées déclarent un modèle de gouvernance mature pour l’IA agentique ; McKinsey constate de même qu’environ un tiers seulement des organisations atteignent le niveau de maturité trois ou plus en matière de gouvernance et de gouvernance de l’IA agentique.

4. Le problème des données que personne n’a résolu avant le pilote

Les limites des données figurent parmi les blocages les plus clairement validés au passage à l’échelle de l’IA agentique : McKinsey rapporte que huit entreprises sur dix citent les limites des données comme un obstacle à ce passage à l’échelle. L’agent n’est pas nécessairement défaillant – les données avec lesquelles il travaille le sont souvent. Les architectures de données existantes des entreprises ont été conçues pour le reporting par lots et des sorties lisibles par l’humain. Les agents ont besoin d’un accès à des données propres, structurées, en temps réel, avec des permissions, un versionnage et une traçabilité appropriés.

La recherche de Tagliabue et al. (arXiv 2025) sur les lakehouses agentiques dignes de confiance rend cela concret : « Même si les capacités de l’IA s’améliorent, la plupart des entreprises ne considèrent pas les agents comme suffisamment fiables pour travailler sur des données de production. » Le chemin vers la fiabilité en production commence par la résolution du problème d’infrastructure, pas du problème de modèle. Un agent fonctionnant sur une couche de données transactionnelle bien conçue, avec contrôles d’accès et pistes d’audit, devient gouvernable. Un agent accédant à des données d’entreprise non structurées via des intégrations ad hoc ne l’est pas.

C’est là que la plupart des pilotes sous-investissent. La démonstration utilise un jeu de données propre. La production hérite de vingt ans de schémas incohérents, de champs manquants et de formats hérités non documentés.

5. La conduite du changement : la dimension humaine que personne n’a budgétée

Les lacunes en compétences et en modèle opérationnel restent des obstacles centraux au passage à l’échelle des agents d’IA. Le défi n’est pas que les employés manquent d’aptitudes techniques. C’est que le déploiement d’un agent autonome dans un processus métier change la manière dont ce processus est détenu, supervisé et corrigé – et la plupart des organisations n’ont pas conçu cette transition.

L’analyse des pilotes d’IA ayant échoué menée par la Questrom School de l’Université de Boston conforte le diagnostic de conception organisationnelle : le fossé entre un pilote réussi et une mise en œuvre réussie est, fondamentalement, un fossé de responsabilité. Les pilotes échouent à l’échelle lorsque l’équipe qui a construit l’agent et l’équipe qui opère le processus concerné sont des groupes différents, avec des incitations différentes et sans structure de responsabilité partagée.

Les organisations qui ont réussi à franchir ce fossé ont créé des équipes dédiées aux opérations d’IA — non pas des équipes de développement d’IA, mais des équipes d’opérations — responsables de la supervision en production, de la maintenance des harnais d’évaluation, de la réponse aux incidents et des revues d’extension de périmètre. La distinction compte. Construire un agent et l’opérer en production ne sont pas le même métier.

6. Ce que les 14 % ont réellement fait différemment

Les organisations qui ont atteint l’échelle de la production partagent un schéma qui relève moins des choix technologiques que de la conception opérationnelle.

Elles ont traité la gouvernance comme une exigence préalable au déploiement, et non comme un audit a posteriori. Les structures de responsabilité, les tableaux de bord de supervision et les guides de réponse aux incidents ont été construits avant la mise en service de l’agent — et non ajoutés après la première défaillance.

Elles ont commencé par des processus à haute fréquence, à faibles enjeux et entièrement réversibles — tri des alertes, classification de documents, validation de données — où le coût des erreurs de l’agent était faible et la boucle de rétroaction pour l’amélioration rapide. Le déploiement d’observabilité agentique d’Adobe (Bharadwaj & Tu, arXiv 2026) l’illustre : commencer par le tri des alertes informatiques, un domaine où les défaillances sont visibles et corrigibles, avant d’étendre le périmètre.

Elles ont investi dans une infrastructure d’évaluation — des harnais de test systématiques capables de vérifier la qualité des sorties de l’agent par rapport aux distributions de données de production, et pas seulement aux scénarios pilotes. La qualité à grand volume n’est pas acquise ; c’est un livrable d’ingénierie qui exige sa propre infrastructure de test.

Et elles ont réalisé l’investissement dans les données en amont. Un accès à des données propres, structurées et gouvernées était un prérequis au déploiement, et non une tâche reportée à la « phase 2 ».

Conclusion

Le fossé de l’adoption des agents est un problème soluble, mais pas un problème technologique. De nombreux pilotes fonctionnent en conditions contrôlées. Le fossé est organisationnel : des cadres de gouvernance conçus pour des travailleurs humains appliqués à des agents autonomes, des architectures de données antérieures aux schémas d’accès qu’exigent les agents, et des approches de conduite du changement qui traitent le déploiement de l’IA comme un déploiement technique plutôt que comme une refonte opérationnelle.

Les entreprises qui combleront ce fossé au cours des 18 prochains mois n’y parviendront pas en trouvant de meilleurs modèles ou des fenêtres de contexte plus grandes. Elles y parviendront en construisant l’infrastructure de production — supervision, gouvernance, accès aux données et propriété opérationnelle — qui rend sûr le fonctionnement des agents à grande échelle.

La vraie question pour les dirigeants d’entreprise est de savoir si la stratégie d’IA de leur organisation inclut un modèle d’opérations de production, ou seulement une feuille de route de pilotes. L’un mène vers le petit groupe qui atteint la production. L’autre mène à une énième preuve de concept annulée.

Le point de vue de Novelis

Chez Novelis, nous travaillons directement avec les équipes d’entreprise qui naviguent à la frontière entre pilote et production. Les blocages décrits ici — déficits de gouvernance, maturité des données, fragmentation de la conduite du changement — sont ceux que nous rencontrons le plus régulièrement sur le terrain. Franchir ce fossé exige une méthodologie structurée, et pas seulement des compétences techniques. Si votre organisation se situe quelque part entre une démonstration impressionnante et un système de production fiable, c’est exactement le territoire sur lequel nous opérons.

Pour aller plus loin

  • The Agentic Reality Check: Preparing for a Silicon-Based Workforce – analyse de Deloitte sur le fossé pilote-production de l’IA agentique : 38 % en pilote, 14 % prêts au déploiement et 11 % en production
  • AI Agent Scaling Gap March 2026: Pilot to Production – enquête du fournisseur DigitalApplied auprès de 650 dirigeants d’entreprise ; éléments indicatifs utiles sur les blocages récurrents du passage à l’échelle
  • Trustworthy AI in the Agentic Lakehouse — Tagliabue et al. (2025) : pourquoi l’infrastructure de données est le fondement de la fiabilité en production
  • With Great Capabilities Come Great Responsibilities: The ARC Framework — Khoo et al. (2025) : cadre de gouvernance pour évaluer et gérer systématiquement les risques de l’IA agentique
  • AI Trust OS: Continuous Governance for Autonomous AI — Bandara et al. (2026) : architecture de gouvernance opérationnelle pour les entreprises qui ne voient pas ce que font leurs agents
  • MIT State of AI in Business 2025: The GenAI Divide – rapport MIT NANDA documentant que 95 % des initiatives d’IA générative étudiées n’ont montré aucun impact mesurable sur le compte de résultat

Si les défis décrits ici font écho à la situation actuelle de votre organisation, nous sommes toujours ouverts à un échange. Les problèmes sont réels, les solutions évoluent vite, et les équipes qui les traversent ensemble vont généralement plus loin.

Blogs recent

Tous les blogs