Si vous lisez Cybernetica depuis le dĂ©but, vous vous rendez probablement compte que beaucoup des prĂ©dictions et des intuitions que nous avons dĂ©veloppĂ©es se sont rĂ©alisĂ©es. Entre lâexplosion du prix de la RAM et des services en ligne (la techflation), et le fait que le sujet de 2026 ne serait pas la souverainetĂ© numĂ©rique mais lâautonomie cognitive, je ne pensais pas que lâactualitĂ© rĂ©cente allait prendre une tournure aussi explicite.
Il y a deux semaines, je vous parlais de lâembargo sur lâintelligence. Washington venait de bloquer Fable 5 et Mythos.
Depuis, le lancement de GPT 5.6, qui nous avait Ă©tĂ© annoncĂ© Ă Paris par les Ă©quipes dâOpenAI, nâest mis en ligne quâau compte-gouttes. Une chose est sĂ»re : les deux modĂšles les plus puissants du marchĂ© ne sont plus disponibles en Europe. Le Splinternet cognitif est une rĂ©alitĂ©.
Cette interdiction arrive au pire moment.
Tout dâabord parce que ces acteurs ont prĂ©vu des entrĂ©es en Bourse et que cela complique leurs lignes de revenus. OpenAI vient dâailleurs de repousser son IPO Ă 2027, citant des conditions compliquĂ©es.
Mais, Ă mon avis, le vrai sujet nâest pas lĂ : cette dĂ©cision arrive alors que la question de lâusage des tokens, la poule aux Ćufs dâor des boĂźtes dâIA, commence Ă Ă©merger. AprĂšs le token maxxing, on entre dans une nouvelle phase dâefficacitĂ©, voire de rĂ©duction de budget, qui ne pouvait ĂȘtre compensĂ©e que par lâarrivĂ©e de modĂšles qui ne sont plus disponibles.
Reprenons.
Cette semaine, le site 404 Media a publiĂ© lâenregistrement dâune rĂ©union interne chez Accenture. On y entend les dirigeants du cabinet sâinquiĂ©ter dâune facture dâIA qui leur Ă©chappe, et dĂ©signer un coupable que personne nâattendait : ce ne sont pas les ingĂ©nieurs qui font exploser la note, ce sont les employĂ©s non techniques. Ceux qui demandent Ă lâIA de transformer un PDF en prĂ©sentation ou de reformater un document, des tĂąches qui, hier encore, ne coĂ»taient que du temps.

Soudain, on dĂ©couvre deux choses : que lâIA a accĂ©lĂ©rĂ© une forme de paresse intellectuelle, câest normal, câest un des espoirs des plateformes pour crĂ©er de lâaddiction ; mais, et nous le verrons plus tard, lâarchitecture de travail existante, comme les PDF, nâest pas faite pour le monde de lâagentique et reste coĂ»teuse en tokens.
Le sticker shock de lâIA en entreprise
Le Financial Times expliquait rĂ©cemment quâUber avait Ă©puisĂ© tout son budget IA de lâannĂ©e dĂšs le mois dâavril, et plafonne dĂ©sormais chaque salariĂ© Ă 1 500 dollars par mois et par outil (ce qui, Ă mon avis, est idiot).
Axios, de son cĂŽtĂ©, a racontĂ© quâune entreprise non nommĂ©e avait dĂ©pensĂ© 500 millions de dollars en un seul mois sur Claude, faute dâavoir mis la moindre limite. Amazon, Walmart, Cisco et mĂȘme Meta, le roi du token maxxing, ont mis le pied Ă fond sur le frein.
Câest le sticker shock de lâIA : le moment oĂč les entreprises dĂ©couvrent que ce quâelles pensaient ĂȘtre un outil magique, vendu au forfait ou absorbĂ© dans les budgets dâinnovation, devient une facture variable, mesurable et parfois incontrĂŽlable.
Accenture, qui vend aujourdâhui le remĂšde avec son offre Token IQ, a dĂ©taillĂ© lâaudit de son propre usage interne : 110 millions de dollars par an sur Claude, dont 79 % gĂ©nĂ©rĂ©s par seulement 20 % des utilisateurs, et 61 % concentrĂ©s sur Opus, le modĂšle le plus cher. Personne, Ă lâintĂ©rieur, ne voyait ce compteur tourner.
Nous avions expliquĂ© dans une prĂ©cĂ©dente newsletter que, pendant deux ans, lâIA sâest vendue au forfait, un prix fixe pour un usage illimitĂ©.
Puis Anthropic et OpenAI ont basculĂ© vers la facturation au token, Ă la quantitĂ© de donnĂ©es traitĂ©e. Câest le directeur informatique de Workato qui en parle le mieux : le jour de la bascule, sa dĂ©pense a Ă©tĂ© multipliĂ©e par sept.
La subvention des tokens devenait insoutenable pour plusieurs raisons : la premiĂšre, câest Ă©videmment que la capacitĂ© en termes de data centers nâĂ©tait plus soutenable, et il fallait aussi « Ă©purer » les mauvaises pratiques de subvention avant lâIPO.
Pourquoi lâIA devient moins chĂšre et plus coĂ»teuse Ă la fois
En frontal, le prix de lâintelligence nâa cessĂ© de baisser. Opus est passĂ© de 15 et 75 dollars le million de tokens Ă 5 et 25, une chute des deux tiers en une seule gĂ©nĂ©ration. Mais les nouveaux modĂšles et les outils agentiques demandent aux modĂšles des tĂąches de plus en plus complexes, de plus en plus longues, de plus en plus enchaĂźnĂ©es. Donc, au final, plus chĂšres.
DĂ©sormais, la question qui est posĂ©e, câest de dĂ©penser plus, mais dâobtenir mieux. Goldman Sachs, citĂ© par le Financial Times, parie sur une multiplication par 24 de la consommation de tokens dâici 2030. Personne ne mise sur moins dâIA pour lâinstant, mais tout le monde commence Ă se demander si « cet argent achĂšte de la valeur ». Pour lâinstant, cela reste difficile Ă expliquer.
On ne payait pas lâintelligence mais lâinefficacitĂ©
Mon intuition, câest quâune large part de la facture actuelle nâachĂšte ni intelligence ni valeur. Elle achĂšte du frottement.
Reprenons le PDF. Un document de 90 pages envoyĂ© en texte brut coĂ»te environ 56 000 tokens. Le mĂȘme en PDF en coĂ»te quatre fois plus, parce que le modĂšle ne lit pas le texte, il photographie chaque page. Le PDF a Ă©tĂ© inventĂ© pour figer un rendu sur une feuille imprimĂ©e, au dĂ©triment de la structure du texte.
Parfait pour un lecteur humain. Absurde quand le lecteur est une machine.
Et le format nâest quâun symptĂŽme. Il ne faut pas oublier les allers-retours inutiles, la maniĂšre maladroite dont on sâadresse aux modĂšles, les agents quâon laisse tourner sans garde-fou : toute cette inefficacitĂ© nous est facturĂ©e au prix fort.
Je travaille sur un nouveau projet que jâannoncerai prochainement sur ces questions.
La rĂ©ponse nâest pas de couper lâIA, mais de construire ce qui manque entre lâhumain et la machine. Câest ce dont nous allons parler ici pour les abonnĂ©s. Pour les lecteurs gratuits, peut-ĂȘtre quâun abonnement annuel sera rentabilisĂ© par les astuces et les informations que nous vous donnons un peu plus loin.
Passez en payant !
Jâai Ă nouveau appris la semaine derniĂšre quâun lecteur qui sâest mis Ă faire tourner une version locale dâIA avait eu la bonne idĂ©e dâacheter son Mac juste avant la hausse de prix dont nous avions parlĂ© Ă plusieurs reprises. RĂ©sultat : 2000 euros Ă©conomisĂ©s, pas mal !
Depuis juin 2026, lâobjectif de Cybernetica change un peu.
DĂ©sormais, nous allons parler dâautonomie cognitive, apprendre Ă mieux utiliser les outils qui sont Ă notre disposition, car nous nâaurons pas forcĂ©ment accĂšs Ă tout. Nous continuerons Ă observer le monde avec rĂ©alisme quand la majoritĂ© des observateurs (et hĂ©las de nombreux professionnels) semblent perdus, voire hagards, par une situation qui, si on nây a pas rĂ©flĂ©chi avec suffisamment dâinformations, semble inextricable.
Merci Ă tous ceux qui nous soutiennent et qui continuent Ă vouloir comprendre comment le monde numĂ©rique (voire le monde tout court) va Ă©voluer dans lâannĂ©e 2026. Il va y avoir beaucoup de rebondissements et de casse, mais nous continuerons Ă explorer le futur ensemble.
Lire l'article complet
S'inscrire maintenant pour lire l'article complet et accéder à tous les articles déstinés aux payants abonnés.
S'abonner