Le directeur technique d'Uber a épuisé le budget IA annuel de l'entreprise en quelques mois. Praveen Neppalli Naga l'a dit sans ambages dans une interview publiée le 14 avril 2026 par The Information : « Je dois tout reprendre à zéro, parce que le budget que je pensais nécessaire a déjà explosé. » Uber emploie plus de 30 000 personnes, affiche 3,4 milliards de dollars de dépenses en R & D pour 2025, en hausse de 9 % sur un an. Or Uber est une véritable machine industrielle qui a décidé d'aller vite, et qui découvre en chemin que l'IA agentique coûte autrement plus cher qu'un abonnement logiciel ou même que l'IA conversationnelle.
Un dépassement révélateur
Ce dépassement révèle un facteur structurel du nouveau monde de l'entreprise : nous manquons encore des modèles managériaux pour mesurer ce que l'IA productive coûte réellement… et ce qu'elle rapporte !
Le nombre de tokens : un indicateur et trois paradoxes
Un collègue de retour de la Silicon Valley me faisait remarquer ce matin que le « token » (cette fraction de mot générée par l'IA après calculs statistiques lancés à partir d'un prompt) devient progressivement la nouvelle monnaie de la tech. À San Francisco, c'est désormais un indicateur clé pour les managers : on mesure la productivité au volume de tokens consommés ! Uber a institué des classements internes pour mesurer quels ingénieurs utilisent le plus les outils d'IA. Résultat : 11 % des mises à jour du code de l'arrière-boutique d'Uber sont aujourd'hui générées par des agents IA, contre une fraction de pourcent quelques mois plus tôt. La progression est spectaculaire. Elle est aussi, en elle-même, peu informative et crée des effets pervers saisissants, où certains employés lancent des tâches IA gourmandes pour simuler une activité intense pendant qu'ils font autre chose…
Mais au-delà de l'anecdote, sécuriser l'accès à ces tokens auprès des géants de l'IA (OpenAI, Anthropic) devient un enjeu de souveraineté à l'échelle de l'entreprise et à l'échelle des nations. Celui qui contrôle l'accès au token contrôle la capacité de croissance, avec des risques de dépendance et de chantage économique que l'Europe n'a pas encore anticipés.
Par ailleurs, ce qui compte n'est pas tant le volume de code produit mais la qualité de ce code telle qu'elle sera perçue dans six mois, dans un an, quand d'autres ingénieurs devront le maintenir, comprendre pourquoi telle décision a été prise ici, corriger ce qui ne tient plus là. Les tableaux de bord affichent de la vélocité. On verra s'ils afficheront aussi de la robustesse.
Un troisième paradoxe est déjà visible dans les chiffres. Selon l'enquête Global AI Pulse de KPMG, publiée en mars 2026 et conduite auprès de 2 110 dirigeants dans le monde, les entreprises en Amérique du Nord et du Sud prévoient de dépenser en moyenne 178 millions de dollars en IA sur les douze prochains mois et 245 millions pour celles d'Asie-Pacifique ainsi que 157 millions pour EMEA. Or les études internes montrent que huit salariés sur dix, dans ces mêmes entreprises, évitent ou n'utilisent tout simplement pas les outils déjà déployés.
Deux structures de coût en concurrence
Un rapport de Goldman Sachs Research publié le 9 mars 2026, intitulé « Will AI Eat Software ? », rapporte que les coûts de production de tokens IA dans les départements d'ingénierie atteignent déjà 10 % des coûts totaux de masse salariale et pourraient atteindre la parité avec les salaires dans les prochains trimestres. Ce chiffre est extraordinaire. La plupart des directions financières ne l'avaient pas modélisé lorsqu'elles ont approuvé leur stratégie IA, douze mois plus tôt. Uber est donc loin d'être le seul à faire ce constat.
On réduit souvent l'IA à une question de remplacement du travail humain. Le vrai sujet est ailleurs : c'est une rupture de paradigme managérial. Un développeur senior coûte entre 150 000 et 400 000 dollars par an, tout compris. C'est lisible dans un budget, prévisible sur plusieurs années. L'IA agentique, elle, est facturée à l'usage (appel aux modèles de langage, cycles de calcul, génération des fameux tokens). Et elle est facturée avec une tarification opaque qu'amplifient les tensions réelles sur l'énergie et les semi-conducteurs. Dans des cycles d'usage intensif, ces coûts peuvent devenir sans limites. C'est un changement de nature que la gouvernance financière des grandes entreprises n'a pas encore su prendre en compte.
L'analyse de Citadel Securities ajoute une couche d'incertitude supplémentaire : si la demande de calcul continue d'augmenter, le coût marginal de la capacité de calcul pourrait finir par dépasser celui du travail humain pour certaines tâches complexes, où l'agent IA doit « réfléchir » si intensément qu'il consomme plus de ressources en quelques secondes que le salaire horaire d'un expert. À quel moment ce croisement se produit-il ? Pour quelles tâches ? Personne ne le sait encore.
La bataille de l'efficacité
Si le token est la monnaie de l'IA, la puissance de calcul en est la banque. Mais c'est une banque dont les réserves sont physiques et limitées. Le modèle d'IA fondé sur la « force brute » se heurte déjà à un mur énergétique. L'exemple de Mythos (le dernier modèle d'Anthropic) est à ce titre un cas d'école : au-delà de ses performances record en cybersécurité, sa distribution est restreinte car il ne serait tout simplement pas viable énergétiquement s'il était déployé à l'échelle mondiale.
Ce plafond de verre impose un changement de doctrine. Les solutions d'IA de demain ne seront pas seulement les plus puissantes, mais les plus « déployables » – les plus pragmatiques en somme. Plutôt que de vider des rivières pour refroidir des processeurs, l'enjeu se déplace vers l'intelligence architecturale. C'est ici que l'Europe a une carte maîtresse à jouer. En se spécialisant dans des modèles à « haute efficacité », elle propose une solution concrète au problème d'Uber : un modèle économique pérenne où la productivité ne signifie plus l'explosion incontrôlée des coûts variables.
Je travaille dans ce secteur depuis 4 ans et je constate chaque semaine que les entreprises déploient des outils sans avoir les instruments pour les évaluer. Les données s'accumulent (Uber, Goldman Sachs, KPMG) mais les grilles d'interprétation manquent encore.
La souveraineté de demain ne se jouera pas sur la taille des data centers, mais sur l'optimisation du ratio « intelligence produite par watt consommé ». La prochaine bataille ne se jouera pas entre l'IA et les humains, mais entre les entreprises capables de piloter cette « haute efficacité », et celles qui découvriront encore, chaque mois d'avril, que leur budget annuel est déjà épuisé.



