Un rapport du MIT révèle que la plupart des investissements dans l’IA échouent et révèle une « fracture GenAI »
- Par David Ramel
- 19/08/2025
Un nouveau rapport du projet NANDA du MIT Media Lab conclut que malgré les 30 à 40 milliards de dollars dépensés par les entreprises en IA générative, 95 % des organisations ne voient aucun retour sur investissement.
Les auteurs du rapport de juillet 2025, intitulé « The GenAI Divide: State of AI in Business 2025 », écrivent : « Les résultats sont si nettement divisés entre les acheteurs (entreprises, entreprises de taille moyenne, PME) et les constructeurs (startups, fournisseurs, cabinets de conseil) que nous l’appelons le GenAI Divide » et notons que « seulement 5 % des pilotes d’IA intégrés extraient des millions de dollars de valeur, tandis que la grande majorité reste bloquée sans impact mesurable sur les P&L. »
Ce que signifie la « fracture GenAI »
Ce clivage se caractérise par une forte adoption, mais une faible transformation. Le rapport indique que seuls deux secteurs présentent des signes clairs de rupture structurelle, tandis que sept autres affichent une « expérimentation généralisée sans transformation ».
L’entreprise s’appuie sur un indice de perturbation du marché de l’IA et cite une interview d’un directeur d’exploitation d’une entreprise de fabrication de taille moyenne : « Le battage médiatique sur LinkedIn laisse entendre que tout a changé, mais dans nos opérations, rien de fondamental n’a changé. Nous traitons certains contrats plus rapidement, mais c’est tout ce qui a changé. »
Du pilote à la production : là où la plupart des efforts stagnent
La preuve la plus flagrante de cette fracture réside dans le déploiement : « seulement 5 % des outils d’IA d’entreprise personnalisés atteignent la production. » Le rapport décrit ce taux d’échec de 95 % pour les solutions d’IA d’entreprise et l’attribue à la fragilité des flux de travail, à un apprentissage contextuel insuffisant et à un manque d’adéquation avec les opérations quotidiennes.
Il constate également le scepticisme des utilisateurs à l’égard des offres des fournisseurs : « Nous avons vu des dizaines de démonstrations cette année. Une ou deux seulement sont réellement utiles. Les autres sont des encapsulations ou des projets scientifiques. »
Les entreprises exécutent le plus grand nombre de projets pilotes mais convertissent le moins ; les organisations de taille moyenne passent plus rapidement du projet pilote à la mise en œuvre complète (environ 90 jours) que les grandes entreprises (neuf mois ou plus).
Chiffres d’adoption et impact sur les entreprises
Les outils polyvalents sont largement explorés, mais leur impact est limité : « Plus de 80 % des organisations ont exploré ou testé [ChatGPT/Copilot], et près de 40 % déclarent les avoir déployés », mais ces outils améliorent principalement la productivité individuelle, et non le compte de résultat. Parallèlement, 60 % des organisations ont évalué des systèmes de niveau entreprise, « mais seulement 20 % ont atteint le stade pilote et seulement 5 % sont entrées en production ».
La cause profonde : le déficit d’apprentissage
L’explication principale du rapport est que le principal obstacle est l’apprentissage plutôt que l’infrastructure, la réglementation ou le talent : « La plupart des systèmes GenAI ne retiennent pas les commentaires, ne s’adaptent pas au contexte et ne s’améliorent pas au fil du temps. »
Les utilisateurs privilégient souvent les interfaces LLM grand public pour les brouillons, mais les rejettent pour les tâches critiques en raison de leur manque de mémoire et de persistance. Une personne interrogée explique : « C’est excellent pour le brainstorming et les premières versions, mais il ne conserve pas les préférences des clients ni ne tire les leçons des modifications précédentes. Il répète les mêmes erreurs et nécessite une saisie contextuelle approfondie à chaque session. Pour les travaux à enjeux élevés, j’ai besoin d’un système qui accumule les connaissances et s’améliore au fil du temps. »
Le rapport résume succinctement cette lacune : « Les limites mêmes de ChatGPT révèlent le problème fondamental derrière la fracture GenAI : il oublie le contexte, n’apprend pas et ne peut pas évoluer. » Pour les tâches complexes et de longue durée, les humains restent la priorité absolue.
Shadow AI : les travailleurs franchissent le fossé de manière informelle
Alors que les programmes officiels accusent du retard, une « économie parallèle de l’IA » a émergé : « seulement 40 % des entreprises déclarent avoir souscrit à un abonnement officiel LLM », et pourtant, les employés de plus de 90 % d’entre elles déclarent utiliser régulièrement des outils d’IA personnels dans le cadre de leur travail. Cette tendance montre que les individus peuvent surmonter le fossé grâce à des outils flexibles, même lorsque les initiatives des entreprises stagnent.
Pourquoi cela est important pour les professionnels de l’informatique et les développeurs axés sur le cloud
Pour les équipes chargées d’opérationnaliser l’IA dans les environnements cloud, le rapport indique que le goulot d’étranglement réside dans les systèmes capables d’apprendre, de mémoriser et de s’intégrer aux systèmes de workflow. Le « clivage » ne concerne pas la qualité des modèles ou la capacité brute de l’infrastructure, mais l’intégration du comportement adaptatif dans la couche applicative et l’orchestration des processus.
Méthodologie
Le rapport s’appuie sur une étude multi-méthodes menée entre janvier et juin 2025. Les chercheurs ont procédé à une revue systématique de plus de 300 initiatives d’IA rendues publiques, mené 52 entretiens structurés avec des représentants d’organisations de tous secteurs et recueilli 153 réponses à des sondages auprès de hauts dirigeants lors de quatre grandes conférences. Les données et citations spécifiques à l’entreprise ont été anonymisées afin de respecter les politiques de divulgation.
Le rapport est disponible sur le référentiel GitHub de nandapapers . Le projet NANDA (Networked Agents and Decentralized Architecture) du MIT développe une infrastructure et des protocoles pour des agents d’IA distribués et interopérables qui peuvent apprendre, collaborer et fournir des résultats commerciaux mesurables.
À propos de l’auteur
David Ramel est rédacteur et écrivain chez Converge 360.