La IA no ha abaratit l'enginyeria. Ha desviat la factura aigües avall.
Cada presentació d'una eina d'IA per programar et ven el mateix: velocitat. Escriu la funcionalitat en minuts, no en dies. Entrega més amb menys gent. Les demos són reals — el primer esborrany arriba de debò en segons.
Després es tanca el trimestre, i la factura apareix en un lloc on no miraves.
Un estudi nou d'Entelligence — un proveïdor, i ja hi tornaré — ha posat número a on apareix. Sobre més d'un milió de pull requests de 2.444 organitzacions d'enginyeria, han seguit on aterra de veritat l'esforç d'enginyeria assistida per IA. La conclusió de titular: per cada dòlar que un equip gasta programant amb IA, uns 18 cèntims es converteixen en producte entregat. Els altres 82 es consumeixen abans que cap funcionalitat arribi a un usuari — gastats arreglant, refent i revisant el que han generat les eines.
No llegeixo aquest número des del seient de l'inversor, ni del proveïdor. El llegeixo des del que ocupo des de fa vint anys: el de qui ha de defensar una línia de cost d'IA davant d'un CFO i fer la guàrdia que enxampa el que les eines han entregat. I des d'aquest seient, els 82 cèntims no són malbaratament. Són la part de la feina que no s'ha automatitzat — i és el millor argument que he vist enguany de per què l'enginyer és la part que no pots convertir en mercaderia.
La IA va abaratir exactament una cosa: el primer esborrany
Treu-li el màrqueting a un assistent d'IA per programar i el que et ven és un primer esborrany més ràpid. Genera codi versemblant a partir del context local — el fitxer on ets, la funció de més amunt, els patrons que ha vist un milió de vegades. Això té valor de debò, i ara és barat de debò.
El que no pot fer és saber quin d'aquests patrons ja va petar a la teva producció el mes passat. Escriu des del repositori, mai des de la realitat: quin cas límit vas provar i revertir, quin reintent «obvi» va tombar el servei de pagaments al març, per què aquell null check que tothom esborra és el que aguanta tot. El model és el motor, i el motor s'ha abaratit — ja vaig argumentar llargament per què un motor barat no és un cotxe barat. Generar codi sempre va ser la part fàcil. Fer que el codi generat sigui cert en producció és la part difícil, i res d'un primer esborrany més ràpid no la fa més fàcil.
Els 82 cèntims són la part que només poden fer els teus enginyers
Mira com l'estudi desglossa el dòlar i el marc de «malbaratament» s'esfondra. D'aquests 82 cèntims: aproximadament 44 se'n van a feina reactiva — arreglar bugs i mantenir els sistemes drets —, 27 a refer codi que no va sobreviure el contacte amb la realitat, i 11 a revisar. Cadascun és una decisió de criteri aigües avall de la generació. Cadascun és la feina de decidir si la cosa versemblant que ha escrit el model és la cosa correcta per entregar.
Aquell dòlar no s'ha esfumat. S'ha reubicat — de teclejar el codi a verificar-lo, integrar-lo i operar-lo. És el mateix moviment que no paro d'assenyalar: el valor puja per la pila, de la capa que el model et pot donar fet a la que no pot. Com més barata es torna la generació, més part del teu dòlar es concentra en el tram que necessita un humà que ja hagi entregat abans. Anomena'l la quota de feina reactiva — i a l'organització mediana d'aquest conjunt de dades, és el 44% de tota la capacitat d'enginyeria, abans de comptar la cua llarga on passa de tres quartes parts.
Les reversions creixen més de pressa que la feina que les genera
Aquí tens el número que hauria de preocupar un CTO més que els 82 cèntims. Al llarg de dotze setmanes, l'estudi va seguir el volum setmanal de pull requests pujant 2,6× — i les PR revertides pujant 3,7×. El fracàs es compon més de pressa que la producció. No només entregues més; entregues més que cal fer enrere.
El mecanisme no té misteri, i no és que els enginyers hagin empitjorat. És que la capa de revisió no va escalar mai amb el volum. Quan multipliques per 2,6× l'entrada d'un procés de verificació sense fer créixer la verificació, la taxa de fuga puja per definició. El mateix informe ho mostra ben clar: gairebé la meitat de les PR s'aproven en menys d'una hora, la majoria de comentaris de revisió són soroll generat per bots, i només una cinquena part dels comentaris arriba a tenir-se en compte. Una de cada quatre línies escrites cada setmana es descarta dins d'aquella mateixa setmana. Pots generar codi a velocitat de màquina. No pots revisar-lo a velocitat de màquina i seguir-ne dient revisió — i la distància entre aquestes dues velocitats és exactament d'on surten les reversions.
Aquest és el número d'un proveïdor — i per què en confio igualment la forma
Ara la part que la majoria de cobertura es va saltar. Entelligence ven la cura. El seu producte tanca «el bucle entre el codi i la producció» — que és, casualment, exactament allò que l'informe conclou que et falta. Quan qui ven un número treu profit de la teva alarma, descompta'l. Sempre.
Dues advertències més que l'informe és prou honest per declarar, i que has de retenir. No hi ha cap línia base prèvia a la IA — això és una diferència de ritme sobre dotze setmanes, no un abans-i-després, així que «la IA ha fet els equips més lents» és una lectura plausible de les dades, no una de demostrada. I «82 cèntims de cada dòlar d'IA» és un model d'on va l'esforç d'enginyeria amb IA; no és el 82% dels diners de la teva empresa cremats. L'informe fins i tot inclou les xifres que van en contra de la seva pròpia alarma: 18 cèntims sí que arriben als usuaris, i aquella taxa d'aprovació en menys d'una hora pot ser tant senyal d'un equip sa i ben equipat com d'un de negligent.
Per tant no confio en el número perquè un proveïdor m'hagi dibuixat un gràfic. Confio en la forma — generació barata, verificació cara, fracàs que es compon — perquè quadra amb el que veig passar a producció cada mes. (Vaig escriure a part sobre com aquesta mateixa forma es va retòrcer fins a dir el que no diu de camí a un titular de Yahoo; el marc és una lliçó per ell sol.)
Aquesta pel·lícula ja l'hem vist — és la factura del cloud, una capa més amunt
Si això et sona, hauria de sonar-te. Quan el cloud va abaratir el còmput, la despesa no va baixar — es va moure, va créixer, i vam passar una dècada inventant el FinOps per governar el que havíem fet fàcil de consumir. Programar amb IA és el mateix moviment una capa més amunt de la pila: va abaratir generar codi, i el cost es va reubicar a verificar-lo i operar-lo. Els tokens són la nova partida, i — com ja he argumentat abans — són un cost per governar, no una productivitat per celebrar. L'enginyer continua sent el multiplicador. La factura només ha canviat d'adreça.
Què faria aquest trimestre si fos el teu CTO
Un diagnòstic sense acció només és una opinió. Cinc apostes concretes:
- Mesura la taxa de fracàs del canvi, no el volum. Les eines optimitzen el nombre de PR; el negoci paga el nombre de les que es reverteixen. Posa mètriques de resultat tipus DORA al panell que la teva direcció llegeix de veritat, i vigila la taxa de fracàs contra la velocitat, no en lloc de la velocitat.
- Tracta les PR escrites per IA com la seva pròpia classe de defecte. Etiqueta-les. Compara'n la taxa de reversió i la vida dels bugs amb els canvis escrits per humans. No pots gestionar un risc que et negues a separar de la mitjana.
- Finança l'arnès, no només el generador. Els 82 cèntims són revisió, verificació i retorn de producció. Gasta-hi. En concret: tanca el teu propi bucle — fes que el que ha petat i s'ha revertit de veritat retorni al context des del qual generen les teves eines, perquè el pròxim esborrany s'escrigui des de la realitat i no des del repo.
- Compta enginyers cap amunt, no cap avall. Els equips que retallen plantilla perquè «ara la IA escriu el codi» estan acomiadant l'única gent que fa que el codi sigui cert. Qui talli més fondo avui es passarà el 2027 tornant a contractar — la feina reactiva no desapareix quan desapareixen els revisors, només s'entrega primer als teus usuaris.
- Governa-ho com el cloud. Atribució de tokens per flux, un botó d'aturada d'emergència a cada agent, i una capa d'enrutament que enviï les tasques trivials al model més barat que faci el fet. El cost descontrolat en una organització d'IA rarament és un enginyer xerraire; és un agent atrapat en un bucle de reintents.
La ratlla que dibuixo
La IA va fer gratis el primer esborrany. No va fer gratis la versió entregada, certa i supervivent — la va fer més valuosa, i n'hi ha més per construir que mai. Els 18 cèntims que arriben als teus usuaris són la part fàcil. Els 82 que no hi arriben són on viu de veritat l'enginyeria, i fer veure que una eina ha eliminat aquesta feina és com acabes l'any explicant una taxa de reversió al teu consell.
El model s'ha abaratit. El criteri no. Si la teva estratègia d'IA confon aquestes dues coses, no tens un equip més ràpid. Tens una neteja més grossa.
Veus la teva taxa de reversió pujar més de pressa que la velocitat des que vas desplegar les eines d'IA? Parla amb un CTO — t'ajudarem a construir la capa de revisió i verificació que converteix un primer esborrany més ràpid en una cosa que puguis entregar de veritat.


