A estatística era verdadeira. O título não.
O mesmo número cruzou o meu feed três vezes na semana passada. Cada passagem era mais alta, e cada passagem era um bocadinho menos verdadeira.
Começou como uma frase cuidadosa num relatório de fornecedor: de cada dólar que uma equipa gasta em programação com IA, cerca de 82 cêntimos são consumidos — a corrigir, refazer, rever — antes de uma funcionalidade chegar a um utilizador. Quando chegou à Yahoo Finance já se tinha transformado em «Up to 82% of AI Engineering Spend Lost to Bugs, Rewrites, and Delays». Mesmo número. Outra afirmação. E a distância entre «consumido num processo» e «perdido» é a história toda.
Acho essa distância mais interessante do que o próprio relatório — e levei a sério os dados do relatório noutro lado. O que aconteceu àqueles dados no caminho até um título é um espécime pequeno e limpo de algo que qualquer líder técnico navega agora todos os dias: como um número real é instrumentalizado para captar atenção num sistema de media que cada vez mais gera, ordena e recompensa conteúdo pela facilidade com que ele viaja — não por ser verdadeiro. Leio uma dúzia destes por semana, e tenho de dizer à minha equipa e aos meus clientes em quais confiar. Por isso deixa-me mostrar-te exatamente como este mutou, salto a salto, e a leitura que agora faço a todos eles.
Um fornecedor mediu algo real — e revelou mais do que os seus amplificadores
Começa por ser justo com a fonte. O número da Entelligence é real, e para um número de fornecedor está invulgarmente bem documentado: mais de um milhão de pull requests, com a amostra e o método nas legendas. Sim, a Entelligence vende a cura — um produto que «fecha o ciclo» entre o código e a produção, que é precisamente aquilo que o relatório conclui que te falta. Esse conflito é real e deves descontá-lo.
Mas eis a reviravolta que a cobertura enterrou: o próprio relatório incluía os números que complicam a sua própria história. Afirma que 18 cêntimos do dólar chegam mesmo a ser entregues. Afirma que quase metade dos pull requests passa a revisão depressa — um número que tanto pode significar uma equipa saudável e bem equipada como uma negligente. O fornecedor, por outras palavras, foi mais cuidadoso do que os meios que o amplificaram. A distorção não aconteceu na fonte. Aconteceu em trânsito. Essa é a parte que vale a pena estudar, porque é em trânsito que a maioria de nós realmente encontra uma estatística.
Salto um: apareceu uma causa que ninguém tinha medido
A primeira amplificação, do SYZ Group, saiu sob um título que cito tal e qual: «44% of every dollar companies spend on AI goes directly to fixing bugs that the AI itself created».
Lê outra vez aquela última oração: bugs that the AI itself created — bugs que a própria IA criou. O estudo mediu uma correlação — à medida que o volume gerado por IA subia, o trabalho reativo subia ao lado. Nunca estabeleceu que a IA escreveu esses bugs. Aquela oração é um acréscimo, e é uma pequena edição com uma mudança total de sentido: um padrão virou culpado, a correlação virou autoria. A culpa atribuída viaja mais longe do que a correlação medida, porque a culpa é uma história mais limpa e uma melhor citação. Fica atento ao verbo que contrabandeia uma causa que os dados nunca provaram — «cria», «provoca», «causa» — aparafusado a um número que só alguma vez mostrou duas coisas a moverem-se juntas.
Salto dois: o verbo mudou, e «consumed» virou «lost»
A segunda amplificação, na Yahoo Finance, largou os dólares e subiu a temperatura: 82% of AI engineering spend lost.
«Consumed» — consumido — descreve dinheiro a fazer trabalho num processo: parte dele desperdício, muito dele o trabalho real e inevitável de entregar software que funciona. «Lost» — perdido — descreve dinheiro destruído, posto a arder, desaparecido. A cifra não mudou um único ponto. Mudou o verbo, e numa estatística é no verbo que a afirmação realmente vive. Consumed, lost, wasted, vanishes, burned — consumido, perdido, desperdiçado, evapora-se, queimado — são cinco medições diferentes a vestir o mesmo número. A percentagem é o disfarce; o verbo é o corpo por baixo.
O número que complicava a história nunca viajou
Agora procura o que está em falta. A conclusão do relatório de que quase metade dos pull requests é aprovada depressa — a que sugere que nem tudo isto é podridão — esteve no conjunto de dados o tempo todo. Nunca chegou a um único título. Claro que não chegou: um número que sussurra «talvez parte disto esteja bem» é uma pior citação do que um que grita «82% perdido».
Este é o indício mais fiável que conheço. O sinal mais claro de uma estatística instrumentalizada não é o número alarmante que está presente — é o número qualificador, do mesmo conjunto de dados, que está ausente. Quando a cifra assustadora viaja e a tranquilizadora morre em silêncio, já não estás a ler investigação. Estás a ler o output de um funil que selecionou contra a metade inconveniente.
É isto que um funil de atenção faz a um facto
Repara no que nenhum destes saltos exigiu: ninguém teve de mentir. Cada passo limitou-se a otimizar para a citação em vez da afirmação — uma percentagem em vez de dólares porque soa maior, «lost» em vez de «consumed» porque soa mais afiado, uma causa em vez de uma correlação porque é mais partilhável, a metade alarmante em vez da tranquilizadora porque o alarme espalha-se. Sem vilão. Apenas um otimizador, a correr sobre cada número, a selecionar o que quer que viaje.
Esse otimizador costumava ser lento e humano. Agora é rápido e, cada vez mais, automático. Num feed onde uma fatia crescente do conteúdo é gerada por máquina e quase tudo é ordenado por engagement, o enquadramento que sobrevive é selecionado pela citabilidade, não pela precisão — e à medida que o conteúdo fica mais barato de produzir, a pressão de seleção só sobe. Isto não é um título mau; é um mecanismo, e merece ser entendido como tal em vez de relitigado caso a caso. Comecei a manter um ficheiro destes espécimes — mesma forma, número diferente, todas as semanas. O padrão é mais instrutivo do que qualquer exemplo isolado, e suspeito que vai passar a importar mais, não menos, daqui para a frente.
Como leio agora uma estatística viral
Não precisas de um diploma em metodologia para te defenderes. Precisas de sete perguntas, e consegues corrê-las no tempo que demora a não carregar em retweet:
- Quem o mediu, e o que é que vende? Um conflito não desqualifica — define a taxa de desconto.
- Qual é o denominador real? 82% de quê — gasto em IA, todo o gasto em engenharia, ou um modelo de um processo? A base é onde se esconde a maior parte do truque.
- Que número do mesmo conjunto de dados foi deixado de fora? Vai procurar a cifra qualificadora que não viajou.
- A causa está provada, ou só afirmada? Separa «X subiu ao lado da IA» de «a IA criou X».
- O que estão os verbos a fazer? «Consumed» e «lost» não são a mesma medição.
- Há baseline, ou é um ritmo sem «antes»? Um rácio assustador sem nada com que comparar é meio facto.
- O título podia ser citado fora de contexto e continuar verdadeiro? Se não, o enquadramento ultrapassou a cifra — e esse intervalo é a história.
Corro estas antes de repetir um número a alguém cujo roadmap se possa mexer por causa dele. Demora trinta segundos, e já me salvou de ser a pessoa que reencaminhou o gráfico.
A linha que traço
A estatística era verdadeira. O título não. E o intervalo entre os dois — o deslize silencioso de «82 cêntimos consumidos num processo» para «82% perdido» — já não é um acidente nem um caso isolado. Num feed saturado de IA está a tornar-se a forma por defeito como um número real chega até ti.
A defesa não é o cinismo. A cifra era genuína e valia a pena conhecê-la; deitar fora todas as estatísticas é só uma forma mais preguiçosa de estar errado. A defesa é ler o enquadramento com o mesmo cuidado com que lês a cifra — porque nesta era o enquadramento faz mais do trabalho, e muito menos dele é feito por alguém a quem possas pedir contas. O número é a parte fácil agora. O que lhe fizeram no caminho até ti é a parte que merece a tua atenção.
A tomar decisões de roadmap ou contratação com base em números como estes? A perícia que te protege não é juntar mais dados — é ler os dados que te entregam. Fala com um CTO sobre construir uma equipa que sabe distinguir o sinal do enquadramento.


