Si vous lisez Cybernetica depuis le début, vous vous rendez probablement compte que beaucoup des prédictions et des intuitions que nous avons développées se sont réalisées. Entre l’explosion du prix de la RAM et des services en ligne (la techflation), et le fait que le sujet de 2026 ne serait pas la souveraineté numérique mais l’autonomie cognitive, je ne pensais pas que l’actualité récente allait prendre une tournure aussi explicite.

Il y a deux semaines, je vous parlais de l’embargo sur l’intelligence. Washington venait de bloquer Fable 5 et Mythos.

Depuis, le lancement de GPT 5.6, qui nous avait été annoncé à Paris par les équipes d’OpenAI, n’est mis en ligne qu’au compte-gouttes. Une chose est sûre : les deux modèles les plus puissants du marché ne sont plus disponibles en Europe. Le Splinternet cognitif est une réalité.

💡

Le problème des plateformes IA n’est plus seulement l’accès aux meilleurs modèles. C’est que leurs clients apprennent à consommer moins cher au moment même où leurs valorisations supposent qu’ils consommeront toujours plus.

Cette interdiction arrive au pire moment.

Tout d’abord parce que ces acteurs ont prévu des entrées en Bourse et que cela complique leurs lignes de revenus. OpenAI vient d’ailleurs de repousser son IPO à 2027, citant des conditions compliquées.

Mais, à mon avis, le vrai sujet n’est pas là : cette décision arrive alors que la question de l’usage des tokens, la poule aux œufs d’or des boîtes d’IA, commence à émerger. Après le token maxxing, on entre dans une nouvelle phase d’efficacité, voire de réduction de budget, qui ne pouvait être compensée que par l’arrivée de modèles qui ne sont plus disponibles.

💡

Cet arrêt dans la hype et le fear of missing out est probablement plus dommageable.

Reprenons.

Cette semaine, le site 404 Media a publié l’enregistrement d’une réunion interne chez Accenture. On y entend les dirigeants du cabinet s’inquiéter d’une facture d’IA qui leur échappe, et désigner un coupable que personne n’attendait : ce ne sont pas les ingénieurs qui font exploser la note, ce sont les employés non techniques. Ceux qui demandent à l’IA de transformer un PDF en présentation ou de reformater un document, des tâches qui, hier encore, ne coûtaient que du temps.

Soudain, on découvre deux choses : que l’IA a accéléré une forme de paresse intellectuelle, c’est normal, c’est un des espoirs des plateformes pour créer de l’addiction ; mais, et nous le verrons plus tard, l’architecture de travail existante, comme les PDF, n’est pas faite pour le monde de l’agentique et reste coûteuse en tokens.

Le sticker shock de l’IA en entreprise

Le Financial Times expliquait récemment qu’Uber avait épuisé tout son budget IA de l’année dès le mois d’avril, et plafonne désormais chaque salarié à 1 500 dollars par mois et par outil (ce qui, à mon avis, est idiot).

Axios, de son côté, a raconté qu’une entreprise non nommée avait dépensé 500 millions de dollars en un seul mois sur Claude, faute d’avoir mis la moindre limite. Amazon, Walmart, Cisco et même Meta, le roi du token maxxing, ont mis le pied à fond sur le frein.

💡

Selon une étude d’UBS, des utilisateurs isolés atteignent 35 000 dollars de facture mensuelle, certaines équipes dépassent leur quota de 200 %, et des entreprises limitent les outils remboursés par la société.

C’est le sticker shock de l’IA : le moment où les entreprises découvrent que ce qu’elles pensaient être un outil magique, vendu au forfait ou absorbé dans les budgets d’innovation, devient une facture variable, mesurable et parfois incontrôlable.

Accenture, qui vend aujourd’hui le remède avec son offre Token IQ, a détaillé l’audit de son propre usage interne : 110 millions de dollars par an sur Claude, dont 79 % générés par seulement 20 % des utilisateurs, et 61 % concentrés sur Opus, le modèle le plus cher. Personne, à l’intérieur, ne voyait ce compteur tourner.

Nous avions expliqué dans une précédente newsletter que, pendant deux ans, l’IA s’est vendue au forfait, un prix fixe pour un usage illimité.

Puis Anthropic et OpenAI ont basculé vers la facturation au token, à la quantité de données traitée. C’est le directeur informatique de Workato qui en parle le mieux : le jour de la bascule, sa dépense a été multipliée par sept.

La subvention des tokens devenait insoutenable pour plusieurs raisons : la première, c’est évidemment que la capacité en termes de data centers n’était plus soutenable, et il fallait aussi « épurer » les mauvaises pratiques de subvention avant l’IPO.

Pourquoi l’IA devient moins chère et plus coûteuse à la fois

En frontal, le prix de l’intelligence n’a cessé de baisser. Opus est passé de 15 et 75 dollars le million de tokens à 5 et 25, une chute des deux tiers en une seule génération. Mais les nouveaux modèles et les outils agentiques demandent aux modèles des tâches de plus en plus complexes, de plus en plus longues, de plus en plus enchaînées. Donc, au final, plus chères.

Désormais, la question qui est posée, c’est de dépenser plus, mais d’obtenir mieux. Goldman Sachs, cité par le Financial Times, parie sur une multiplication par 24 de la consommation de tokens d’ici 2030. Personne ne mise sur moins d’IA pour l’instant, mais tout le monde commence à se demander si « cet argent achète de la valeur ». Pour l’instant, cela reste difficile à expliquer.

On ne payait pas l’intelligence mais l’inefficacité

Mon intuition, c’est qu’une large part de la facture actuelle n’achète ni intelligence ni valeur. Elle achète du frottement.

Reprenons le PDF. Un document de 90 pages envoyé en texte brut coûte environ 56 000 tokens. Le même en PDF en coûte quatre fois plus, parce que le modèle ne lit pas le texte, il photographie chaque page. Le PDF a été inventé pour figer un rendu sur une feuille imprimée, au détriment de la structure du texte.

Parfait pour un lecteur humain. Absurde quand le lecteur est une machine.

Et le format n’est qu’un symptôme. Il ne faut pas oublier les allers-retours inutiles, la manière maladroite dont on s’adresse aux modèles, les agents qu’on laisse tourner sans garde-fou : toute cette inefficacité nous est facturée au prix fort.

💡

Dans un monde du travail pensé pour des humains, une grande partie de ce que nous payons aujourd’hui, c’est le coût de traduction entre deux mondes qui ne se comprennent pas encore.

Je travaille sur un nouveau projet que j’annoncerai prochainement sur ces questions.

La réponse n’est pas de couper l’IA, mais de construire ce qui manque entre l’humain et la machine. C’est ce dont nous allons parler ici pour les abonnés. Pour les lecteurs gratuits, peut-être qu’un abonnement annuel sera rentabilisé par les astuces et les informations que nous vous donnons un peu plus loin.

Passez en payant !

J’ai à nouveau appris la semaine dernière qu’un lecteur qui s’est mis à faire tourner une version locale d’IA avait eu la bonne idée d’acheter son Mac juste avant la hausse de prix dont nous avions parlé à plusieurs reprises. Résultat : 2000 euros économisés, pas mal !

Depuis juin 2026, l’objectif de Cybernetica change un peu.

Désormais, nous allons parler d’autonomie cognitive, apprendre à mieux utiliser les outils qui sont à notre disposition, car nous n’aurons pas forcément accès à tout. Nous continuerons à observer le monde avec réalisme quand la majorité des observateurs (et hélas de nombreux professionnels) semblent perdus, voire hagards, par une situation qui, si on n’y a pas réfléchi avec suffisamment d’informations, semble inextricable.

Merci à tous ceux qui nous soutiennent et qui continuent à vouloir comprendre comment le monde numérique (voire le monde tout court) va évoluer dans l’année 2026. Il va y avoir beaucoup de rebondissements et de casse, mais nous continuerons à explorer le futur ensemble.

S’abonner aujourd'hui et profiter du tarif actuel

Lire l'article complet

S'inscrire maintenant pour lire l'article complet et accéder à tous les articles déstinés aux payants abonnés.

Vous avez déjà un compte ? Se connecter

🔴 L’économie des tokens tiendra-t-elle jusqu'aux IPO ?

Le sticker shock de l’IA en entreprise

Pourquoi l’IA devient moins chère et plus coûteuse à la fois

On ne payait pas l’intelligence mais l’inefficacité

Lire l'article complet

Lire la suite

L'espace latent du milieu

🔴 Embargo sur l'intelligence

🔴 La fracture cognitive entre dans une nouvelle phase