Il y a trois ans encore les prix des premiers modèles d’IA étaient clairement annoncés par les fournisseurs, désormais il n’y a plus aucune certitude pour les entreprises quant au coût de leur usage de l’IA. En cause l’IA agentique qui requiert plus de données ainsi que de nombreux ajustements.
Les fonctionnalités dédiées au codage sont celles qui connaissent actuellement le plus de succès en matière d’IA. Claude Code apparu il y a quelques mois génère déjà 2,5 milliards de dollars de revenus annualisés. OpenAI témoin de ce succès fulgurant n’est pas resté sans riposter et a lancé une nouvelle application Codex App basée sur son dernier modèle GPT-5.5. Les qualités de cet outil sont nombreuses : capacités élargies, algorithme capable d’interagir avec son environnement pour effectuer des tâches de manière plus ou moins autonome, interface au design soigné, possibilité de piloter les agents IA depuis une application mobile. Tout est pensé pour séduire un public très lucratif, celui des développeurs.
Cependant ces nouvelles possibilités d’usage s’accompagnent d’une tarification plus complexe. Au lancement des premiers modèles d’intelligence artificielle, Google, OpenAI ainsi que tous les autres acteurs du domaine proposaient majoritairement une offre gratuite grand public, une offre payante entre 10 et 20 dollars par mois et enfin une offre professionnelle entre 100 et 200 dollars par utilisateur. Les développeurs, quant à eux, payaient déjà au « token » (la plus petite unité traitée par l’IA) pour accéder à l’interface de l’application (API).
Aujourd’hui le traitement de tâches plus complexes comme la résolution de problèmes de recherche, la création de fichiers de calcul, la construction intégrale d’applications, nécessite des capacités de calcul plus élevées. Les modèles d’IA offrent ainsi des abonnements qui reposent sur des crédits. Une fois ceux-ci épuisés, le développeur peut payer au token supplémentaire traité (par paquet d’un million). Dans ce contexte, la facture à l’usage devient plus incertaine.
Le prix du token en lui-même n’augmente pas, il a plutôt tendance à baisser. Il est divisé en moyenne par dix chaque année. Mais c’est bien l’augmentation de la consommation avec l’arrivée des modèles de raisonnement et de l’agentique qui alourdit les coûts liés à l’IA des entreprises. Les développeurs font donc preuve d’ingéniosité en cherchant des techniques d’optimisation de leurs usages de l’IA. Quant aux fournisseurs de ces services, cette nouvelle modération des consommateurs leur permet de réduire la surcharge de leurs serveurs due à des requêtes massives.
Cette frugalité forcée pourrait être satisfaisante à bien des points de vue si elle ne s’accompagnait pas de pratiques opaques de la part des fournisseurs. En effet des chercheurs ont découvert de nombreuses anomalies pouvant nuire au rapport qualité-prix.
Tout d’abord, deux modèles d’IA peuvent avoir des coûts totalement différents pour une même tâche. De même un seul modèle d’IA peut générer des coûts variables pour le traitement d’un même problème. Et ces variations ne peuvent faire l’objet d’aucune prévision fiable de la part des agents IA, au contraire, ils ont plutôt tendance à sous-estimer systématiquement le nombre de tokens nécessaires pour la requête. Le coût plus élevé en tokens ne constitue pas non plus l’assurance d’un meilleur résultat. La seule solution pour les entreprises est de fixer des limites aux agents IA quitte à provoquer leur arrêt avant l’achèvement des tâches.
Les chercheurs ont mis en évidence que la complexité de la tâche n’est pas la cause du surcoût, mais que celui-ci est lié à la tendance comportementale du modèle d’agent IA. On peut également citer un autre facteur qui contribue à alourdir la facture : l’incapacité des agents à déterminer le caractère insoluble d’une tâche. Cet entêtement à vouloir apporter une solution est aussi une source d’augmentation des dépenses.
Parmi les différentes phases d’usage des agents IA, celle de l’entrée des tokens est la plus coûteuse. L’IA agentique qui nécessite de s’appuyer sur des informations antérieures est ainsi plus consommatrice de tokens. Une réflexion autour de la pertinence de l’étendue des données d’entrée est un préalable nécessaire pour maîtriser son budget. Cependant il n’est pas concevable que les fournisseurs soient affranchis de leur responsabilité de produire une offre claire. Les utilisateurs professionnels devraient réclamer a minima que les agents IA soient en mesure de les avertir des dépassements budgétaires par des systèmes d’alerte.
Si l’on devait toutefois trouver un avantage à cette situation, il concernerait l’aspect humain. En effet jusqu’à présent l’inquiétude dans le monde du développement informatique concernait l’impact sur l’emploi de ces nouvelles technologies, or cette nouvelle tarification des agents IA est de nature à modifier les stratégies en matière de RH des entreprises. Entre des agents IA gourmands en tokens coûteux et des développeurs au service de leur entreprise soucieux d’efficience, ces derniers apparaissent plus que jamais indispensables à la pérennité de leurs organisations.
SOURCES :
« Face au succès d’Anthropic, OpenAI mise sur le code », Les Echos n°24717 du 22 mai 2026
« Les développeurs deviennent des machines à consommer du token : la facture de l’IA donne des sueurs froides aux entreprises », Les Echos.fr du 12 mai 2026
