Reptes

El coll d'ampolla dels teus agents no és el model: és la memòria que mai no els has construït

Per Marc Molas·6 de juny del 2026·9 min de lectura

McKinsey acaba de prometre't lliurament de software les 24 hores.

A «Rewiring software delivery for the agentic era» descriuen un món on l'sprint de dues setmanes es comprimeix a un sprint diari, els agents treballen de nit mentre tu dorms, i els equips de vuit a dotze persones donen pas a pods petits que supervisen. És una promesa maca, i el diagnòstic de fons és força encertat. Però, com gairebé totes les promeses maques de consultora, es salta la part avorrida: si els teus agents encara no fan el torn de nit, no és pel model que fan servir. És que no els has construït la memòria.

No escric això des de la cadira del consultor que dibuixa l'operating model, sinó des de la de qui opera la plataforma on aterren aquests agents. Porto prou anys de DevOps i de guàrdies a les tres de la matinada per saber una cosa: un agent autònom de nit és exactament el mateix que un enginyer de guàrdia acabat d'arribar. Brillant, incansable i completament inútil si ningú li ha deixat per escrit com funciona de debò el sistema. El model li dona el cervell. El que li falta no és cervell.

El model no és el coll d'ampolla; el context que falta, sí

Pensa en què necessita de debò un agent per desplegar un canvi als teus sistemes sense petar res. No necessita ser més llest. Necessita saber què vol dir «client de risc» al teu sector. Necessita saber quin dels sis passos d'aquell procés de devolució no s'ha de saltar mai. Necessita saber per què aquell servei es va construir d'aquella manera tan rara, i que va ser per un incident del trimestre passat que va acabar amb la decisió de no fer mai reintents automàtics contra aquell endpoint.

Res d'això viu als pesos del model. Viu als caps de tres persones, en un fil de Slack que ningú trobarà, en un Confluence que no s'actualitza des de fa un any, en un tiquet de Jira tancat i en un post-mortem que ningú ha rellegit. El model més potent del planeta, sense aquest context, és un fitxatge al seu primer dia, sense onboarding. Pots posar-li el millor cervell del mercat: si no sap com funciona la teva empresa, endevinarà. I un agent que endevina a producció no és productivitat, és deute.

Les quatre condicions de McKinsey són, en realitat, una de sola

L'article enumera quatre condicions perquè els agents funcionin: una visió de negoci clara del que s'ha de construir, un entorn tècnic estàndard amb frameworks comuns i arquitectura modular, una estructura estàndard de requisit a codi perquè els inputs siguin predictibles, i stakeholders implicats al llarg de tot el value stream.

Quatre caselles. Però si les mires de prop, totes apunten al mateix lloc. No són quatre requisits independents: són quatre cares d'un sol substrat. Totes quatre consisteixen a fer el context de la teva organització prou llegible i fiable perquè una màquina hi pugui raonar. La visió clara és context sobre el què. L'entorn estàndard és context sobre el com. L'estructura de requisit a codi és context en un format que l'agent pot consumir sense haver d'interpretar. I els stakeholders implicats són la garantia que aquest context no es desincronitza de la realitat a mitja setmana. McKinsey ho ven com una llista; a la trinxera és una sola cosa, i té nom.

El knowledge graph és la capa de memòria de la IA

Aquí és on l'article diu la cosa de debò interessant, i és la que t'hauries d'emportar a casa. Les empreses que van al davant estan construint knowledge graphs que funcionen com una capa de memòria d'IA al llarg de tot el cicle de vida del software, un per domini: connecten el feedback dels clients, els registres de decisions d'arquitectura, els documents de disseny, els tiquets, l'activitat de GitHub, els informes d'incidents i les regles de compliance.

La paraula clau és connecten. Un sistema de RAG sobre un wiki — ja en vaig escriure per a qui integra LLMs — et recupera el paràgraf que casa amb les paraules de la pregunta. Útil, però pla. Una capa de memòria de debò sap una altra cosa: sap que aquest incident va provocar aquell registre de decisió, que restringeix aquest servei, el responsable del qual va escriure aquella regla de compliance. El valor no és als nodes, és a les arestes. La diferència entre les dues coses és la diferència entre un agent que et cita el wiki i un agent que respecta les teves cicatrius.

I aquesta és exactament la capa que argumentava que era el fossat: el model converteix en mercaderia el 80% fàcil, i la diferenciació es trasllada al sistema que l'envolta. La memòria de com funciona de debò la teva empresa és la part d'aquest sistema que cap proveïdor de models et pot vendre, perquè no la té.

Ja havíem codificat coneixement tribal abans, i en vam dir infraestructura com a codi

Si això et sona, és perquè els que venim d'operacions ja hem fet aquest moviment unes quantes vegades. Cada salt cap a l'autonomia, sense excepció, ha estat el mateix gest: agafar coneixement que vivia al cap d'un enginyer sènior i codificar-lo perquè una màquina hi pogués actuar.

Els runbooks a mà van esdevenir remediació automàtica. Els passos de desplegament que només sabia una persona van esdevenir un pipeline de CI/CD. El «pregunta-ho a la Maria, que ella sap com està cablejada la producció» va esdevenir infraestructura com a codi. I el detall que tothom oblida: el pipeline no es va posar a funcionar sol perquè les eines s'haguessin tornat llestes. S'hi va posar quan vam escriure el que sabia la Maria. Els agents que lliuren software de nit són exactament aquesta lliçó, un pis més amunt. L'agent treballa sense supervisió fins exactament on el seu context li ho permet, i ni un pas més enllà. El substrat no és cap màgia nova; és coneixement tribal, finalment escrit en un format que una màquina pot recórrer.

El lliurament 24 hores és el premi, no l'objectiu

Per això la cadència diària que ven McKinsey és real, però va darrere del substrat, no davant. L'execució nocturna funciona fins on la memòria de l'agent el deixa arribar tot sol; passada aquella línia, s'atura i espera un humà. Així que la mètrica que importa no és «poden treballar de nit, els agents?», sinó fins on arriba l'agent abans de topar amb una pregunta que només una persona pot respondre — i cadascuna d'aquestes aturades és un bug de context a la teva capa de memòria, no una fallada del model.

Aquí deixa'm concedir el contraargument fort, perquè és bo: «els models milloren cada trimestre, les finestres de context no paren de créixer… no s'ho menjarà tot, això, el proper model?». En part, sí. Part de la bastida d'avui quedarà absorbida: els models millors demanen menys acompanyament, i les finestres més grans s'empassen més documents d'un sol cop. Però una finestra de context no és una memòria. Enganxar tot el wiki al prompt no fa que el model sàpiga quin pas no es pot saltar mai; fa que llegeixi una pila de text potser contradictori i endevini. Saber exigeix curació, verificació, frescor i resolució de conflictes: decidir quina de dues fonts que es contradiuen és la veritat que val avui. Això és criteri, ho fa un humà, i és feina d'enginyeria permanent. El model és de lloguer, i idèntic per a l'empresa del davant. La memòria curada de com funciona de debò la teva empresa és la part que ningú et pot llogar.

Què faria jo aquest trimestre si fos el teu CTO

Cinc apostes concretes, perquè el diagnòstic sense acció és només una opinió maca:

Localitza on viu de debò el teu context. Abans de comprar cap «fàbrica d'agents», fes l'inventari incòmode: quant del coneixement que un agent necessitaria per lliurar codi viu només en caps, en fils de Slack i en un wiki caducat? Aquesta resposta és el teu coll d'ampolla. No el model.
Construeix la memòria d'UN domini, no de tota l'empresa. El knowledge graph de tot l'SDLC d'un sol cop és un projecte que mor en comitè. Tria un domini que faci mal de debò, connecta'n els registres de decisió, els tiquets, els incidents i les regles de compliance, i fes que un agent hi raoni. Aprèn-hi abans d'escalar.
Estandarditza el camí de requisit a codi. És la condició de McKinsey que de debò mou l'agulla. Si cada feature entra en un format diferent, l'agent endevina; si entra en una estructura predictible, executa. Inputs reproduïbles abans que outputs autònoms.
Encasta el compliance dins la memòria, no al final. Les regles de risc, legal i seguretat han de ser nodes que l'agent llegeix mentre construeix, no una porta que algú obre quan ja està tot fet. Un control que viu al graf millora la traçabilitat i la completesa; un control que viu en un PDF és un coll d'ampolla amb cara de persona.
Mesura l'autonomia per fins on arriba l'agent tot sol. Oblida't del «percentatge de codi escrit per IA». La mètrica honesta és quants passos encadena un agent abans de necessitar un humà — i tractar cada aturada com un bug de context que s'arregla al substrat, no com un sostre del model.

La línia que defenso és la de sempre, i aquí la IA la il·lustra de la manera més literal que he vist mai: no substitueix l'enginyer, li fa de palanca. Algú ha de decidir quina de dues fonts contradictòries és la veritat, quin pas no es salta mai, quan un coneixement ha caducat. Aquesta feina — construir i mantenir la memòria de com funciona de debò la teva empresa — no la fa el model. La fa un enginyer amb criteri. I com més autònoms vulguis els agents, més enginyers necessites, no menys.

McKinsey ven el destí: agents que lliuren software mentre dorms. I té raó: és possible. El que la diapositiva s'estalvia és que el motor barat i intercanviable mai ha estat el problema. El problema, com sempre, és tot el cotxe que l'envolta — i aquesta vegada, la peça més difícil de construir es diu memòria.

Estàs intentant que els teus agents passin de la demo a producció, i el que se't desincronitza sempre és el context, no el model? Parla amb un CTO sobre com muntar l'squad nearshore que et construeixi la capa de memòria, i no només que et cablegi l'agent.

El coll d'ampolla dels teus agents no és el model: és la memòria que mai no els has construït

El model no és el coll d'ampolla; el context que falta, sí

Les quatre condicions de McKinsey són, en realitat, una de sola

El knowledge graph és la capa de memòria de la IA

Ja havíem codificat coneixement tribal abans, i en vam dir infraestructura com a codi

El lliurament 24 hores és el premi, no l'objectiu

Què faria jo aquest trimestre si fos el teu CTO

Articles Relacionats

La mort del software és molt exagerada (i el mercat ho ha llegit al revés)

Agentic-as-a-Service i el retorn de l'enginyer

Després de l'automatització: el framer, no el frame, és on encara viu la feina

Preparat per construir el teu equip d'enginyeria?