Défis

La statistique était vraie. Le titre, non.

Par Marc Molas·9 juin 2026·8 min de lecture

Le même chiffre a traversé mon fil trois fois la semaine dernière. Chaque passage était plus bruyant, et chaque passage était un peu moins vrai.

Cela a commencé par une phrase prudente dans un rapport éditeur : sur chaque dollar qu'une équipe dépense en IA de codage, environ 82 centimes sont consommés — corrigés, repris, relus — avant qu'une fonctionnalité n'atteigne un utilisateur. Le temps d'arriver sur Yahoo Finance, c'était devenu « Up to 82% of AI Engineering Spend Lost to Bugs, Rewrites, and Delays ». Même chiffre. Affirmation différente. Et la distance entre « consommé dans un processus » et « perdu » est toute l'histoire.

Je trouve cette distance plus intéressante que le rapport lui-même — et j'ai pris les données du rapport au sérieux ailleurs. Ce qui est arrivé à ces données en chemin vers un titre est un petit spécimen, net, de quelque chose que tout dirigeant technique navigue désormais au quotidien : comment un chiffre réel se trouve instrumentalisé pour capter l'attention dans un système médiatique qui, de plus en plus, génère, classe et récompense le contenu selon sa capacité à voyager — et non selon sa véracité. J'en lis une douzaine par semaine, et je dois dire à mon équipe et à mes clients lesquels mériter confiance. Alors laissez-moi vous montrer exactement comment celui-ci a muté, saut après saut, et la lecture que je fais désormais de tous.

Un éditeur a mesuré quelque chose de réel — et en a divulgué plus que ses amplificateurs

Commençons par être juste envers la source. Le chiffre d'Entelligence est réel, et pour un chiffre d'éditeur il est exceptionnellement bien sourcé : plus d'un million de pull requests, avec l'échantillon et la méthode posés dans les légendes. Oui, Entelligence vend le remède — un produit qui « boucle la boucle » entre le code et la production, c'est-à-dire précisément ce que le rapport conclut qu'il vous manque. Ce conflit est réel et vous devez l'intégrer dans le prix.

Mais voici le retournement que la couverture médiatique a enterré : le rapport lui-même incluait les chiffres qui compliquent sa propre histoire. Il indique que 18 centimes du dollar sont bel et bien livrés. Il indique que près de la moitié des pull requests passent la revue rapidement — un chiffre qui pourrait signaler une équipe saine et bien outillée plutôt qu'une équipe négligente. L'éditeur, autrement dit, était plus prudent que les médias qui l'ont amplifié. La distorsion ne s'est pas produite à la source. Elle s'est produite en transit. C'est la partie qui mérite l'étude, car c'est en transit que la plupart d'entre nous rencontrons réellement une statistique.

Premier saut : une cause est apparue, que personne n'avait mesurée

La première amplification, signée SYZ Group, est parue sous un titre que je cite mot pour mot : « 44% of every dollar companies spend on AI goes directly to fixing bugs that the AI itself created ».

Relisez cette dernière proposition : bugs that the AI itself created — des bugs que l'IA elle-même a créés. L'étude a mesuré une corrélation — à mesure que le volume généré par IA montait, le travail réactif montait avec lui. Elle n'a jamais établi que l'IA avait rédigé ces bugs. Cette proposition est un ajout, et c'est une petite retouche au changement de sens total : un schéma est devenu un coupable, la corrélation est devenue une paternité. Le blâme attribué voyage plus loin que la corrélation mesurée, parce que le blâme est une histoire plus nette et une meilleure citation. Guettez le verbe qui fait passer en contrebande une cause que les données n'ont jamais prouvée — « crée », « provoque », « cause » — boulonné à un chiffre qui n'a jamais montré que deux choses bougeant ensemble.

Deuxième saut : le verbe a changé, et « consumed » est devenu « lost »

La deuxième amplification, sur Yahoo Finance, a laissé tomber les dollars et fait monter la température : 82% of AI engineering spend lost.

« Consumed » décrit de l'argent qui travaille dans un processus — une partie gaspillée, une bonne part étant le travail réel et inévitable de livrer un logiciel qui fonctionne. « Lost » décrit de l'argent détruit, parti en fumée, disparu. Le chiffre n'a pas bougé d'un point. C'est le verbe qui a changé, et dans une statistique le verbe est l'endroit où vit réellement l'affirmation. Consumed, lost, wasted, vanishes, burned — consommé, perdu, gaspillé, évaporé, brûlé — sont cinq mesures différentes portant le même chiffre. Le pourcentage est le costume ; le verbe est le corps en dessous.

Le chiffre qui compliquait l'histoire n'a jamais voyagé

Cherchez maintenant ce qui manque. Le constat du rapport selon lequel près de la moitié des pull requests sont approuvées rapidement — celui qui suggère que tout ceci n'est pas pourriture — était dans le jeu de données depuis le début. Il n'a atteint aucun titre. Évidemment : un chiffre qui chuchote « peut-être qu'une partie de tout ça va bien » est une moins bonne citation qu'un chiffre qui hurle « 82 % perdus ».

C'est le signe le plus fiable que je connaisse. Le signe le plus clair d'une statistique instrumentalisée, ce n'est pas le chiffre alarmant qui est présent — c'est le chiffre nuançant, issu du même jeu de données, qui est absent. Quand la donnée effrayante voyage et que la donnée rassurante meurt en silence, vous ne lisez plus de la recherche. Vous lisez la sortie d'un entonnoir qui a sélectionné contre la moitié gênante.

Voilà ce qu'un entonnoir d'attention fait à un fait

Remarquez ce qu'aucun de ces sauts n'a exigé : personne n'a eu besoin de mentir. Chaque étape a simplement optimisé la citation plutôt que l'affirmation — un pourcentage plutôt que des dollars parce que ça sonne plus gros, « lost » plutôt que « consumed » parce que ça sonne plus tranchant, une cause plutôt qu'une corrélation parce que c'est plus partageable, la moitié alarmante plutôt que la moitié rassurante parce que l'alarme se propage. Pas de méchant. Juste un optimiseur, tournant sur chaque chiffre, sélectionnant ce qui voyage.

Cet optimiseur était autrefois lent et humain. Il est désormais rapide et, de plus en plus, automatique. Dans un fil où une part croissante du contenu est générée par machine et où presque tout est classé selon l'engagement, le cadrage qui survit est sélectionné pour sa citabilité, pas pour son exactitude — et plus le contenu devient bon marché à produire, plus la pression de sélection grimpe. Ce n'est pas un mauvais titre isolé ; c'est un mécanisme, et il mérite d'être compris comme tel plutôt que rejugé cas par cas. J'ai commencé à tenir un dossier de ces spécimens — même forme, chiffre différent, chaque semaine. Le motif est plus instructif que n'importe quel exemple isolé, et je soupçonne qu'il comptera davantage, pas moins, à partir d'ici.

Comment je lis désormais une statistique virale

Pas besoin d'un diplôme en méthodologie pour vous défendre. Il vous faut sept questions, et vous pouvez les passer en revue dans le temps qu'il faut pour ne pas cliquer sur « retweeter » :

Qui l'a mesuré, et que vend cette personne ? Un conflit d'intérêt n'est pas disqualifiant — il fixe le taux de décote.
Quel est le vrai dénominateur ? 82 % de quoi — la dépense IA, toute la dépense d'ingénierie, ou un modèle d'un processus ? La base, c'est là que se cache l'essentiel du tour de passe-passe.
Quel chiffre du même jeu de données a été lâché ? Allez débusquer la donnée nuançante qui n'a pas voyagé.
La cause est-elle prouvée, ou seulement affirmée ? Séparez « X a monté en même temps que l'IA » de « l'IA a créé X ».
Que font les verbes ? « Consumed » et « lost » ne sont pas la même mesure.
Y a-t-il une référence, ou est-ce un taux sans aucun « avant » ? Un ratio effrayant sans rien à quoi le comparer est un demi-fait.
Le titre pourrait-il être cité hors contexte et rester vrai ? Sinon, le cadrage a dépassé le chiffre — et cet écart, c'est l'histoire.

Je les passe en revue avant de répéter un chiffre à quiconque dont la feuille de route pourrait bouger à cause de lui. Ça prend trente secondes, et ça m'a épargné d'être celui qui a fait suivre le graphique.

La ligne que je trace

La statistique était vraie. Le titre, non. Et l'écart entre les deux — le glissement discret de « 82 centimes consommés dans un processus » à « 82 % perdus » — n'est plus un accident ni un cas isolé. Dans un fil saturé d'IA, il devient la façon par défaut dont un chiffre réel vous parvient.

La défense, ce n'est pas le cynisme. Le chiffre était authentique et mérite d'être connu ; jeter chaque statistique n'est qu'une façon plus paresseuse d'avoir tort. La défense, c'est de lire le cadrage avec autant de soin que vous lisez le chiffre — parce qu'à cette époque le cadrage fait davantage le travail, et bien moins de ce travail est fait par quelqu'un que vous puissiez tenir pour responsable. Le chiffre est désormais la partie facile. Ce qu'on lui a fait subir sur le chemin jusqu'à vous, voilà la partie qui mérite votre attention.

Vous prenez des décisions de feuille de route ou de recrutement sur la base de chiffres comme ceux-ci ? La compétence qui vous protège, ce n'est pas de rassembler plus de données — c'est de lire les données qu'on vous tend. Parlez à un CTO pour bâtir une équipe capable de distinguer le signal du cadrage.

La statistique était vraie. Le titre, non.

Un éditeur a mesuré quelque chose de réel — et en a divulgué plus que ses amplificateurs

Premier saut : une cause est apparue, que personne n'avait mesurée

Deuxième saut : le verbe a changé, et « consumed » est devenu « lost »

Le chiffre qui compliquait l'histoire n'a jamais voyagé

Voilà ce qu'un entonnoir d'attention fait à un fait

Comment je lis désormais une statistique virale

La ligne que je trace

Articles Connexes

La Cohérence N'Est Pas la Correction : Pourquoi un Article a Besoin de Thèses Vérifiables, Pas d'une Prose Impeccable

L'IA n'a pas rendu l'ingénierie moins chère. Elle a déplacé la facture en aval.

« Le logiciel est mort » : une exagération (et comment le marché a tout lu de travers)

Prêt à construire votre équipe d'ingénierie ?