← Tornar a tots els articles
Reptes

El coll d'ampolla dels teus agents no és el model: és la memòria que no els has construït

Per Marc Molas·6 de juny del 2026·9 min de lectura

McKinsey acaba de prometre't lliurament de software les 24 hores.

A «Rewiring software delivery for the agentic era» descriuen un món on l'sprint de dues setmanes es comprimeix a un sprint diari, els agents executen de nit mentre tu dorms, i els equips de vuit a dotze persones donen pas a pods petits que supervisen. És una promesa maca, i el diagnòstic de fons és correcte gairebé sempre. Però, com gairebé totes les promeses maques de consultora, salta la part avorrida: el motiu pel qual els teus agents encara no fan torn de nit no és el model que fan servir. És que no els has construït la memòria.

No escric això des de la cadira del consultor que dibuixa l'operating model, sinó des de la del que opera la plataforma on aterren aquests agents. Porto prou anys de DevOps i de guàrdies a les tres de la matinada per saber una cosa: un agent autònom a la nit és exactament el mateix que un enginyer de guàrdia acabat d'incorporar. Brillant, incansable i completament inútil si ningú li ha deixat per escrit com funciona de debò el sistema. El model li dóna el cervell. El que li falta no és cervell.

El model no és el coll d'ampolla; el context que falta, sí

Pensa en què necessita de debò un agent per enviar un canvi contra els teus sistemes sense petar res. No necessita ser més llest. Necessita saber què vol dir «client de risc» al teu sector. Necessita saber quin dels sis passos d'aquell procés de devolució no s'ha de saltar mai. Necessita saber per què aquell servei es va construir d'aquella manera tan rara, i que va ser per un incident del trimestre passat que va acabar amb la decisió de no fer mai reintents automàtics contra aquell endpoint.

Res d'això viu als pesos del model. Viu als caps de tres persones, en un fil de Slack que ningú trobarà, en un Confluence que no s'actualitza des de fa un any, en un tiquet de Jira tancat i en un post-mortem que ningú ha rellegit. El model més potent del planeta, sense aquest context, és un fitxatge el primer dia sense onboarding. Pots posar-li el millor cervell del mercat: si no sap com funciona la teva empresa, endevinarà. I un agent que endevina a producció no és productivitat, és deute.

Les quatre condicions de McKinsey són, en realitat, una de sola

L'article enumera quatre condicions perquè els agents funcionin: una visió de negoci clara del que s'ha de construir, un entorn tècnic estàndard amb frameworks comuns i arquitectura modular, una estructura estàndard de requisit a codi perquè els inputs siguin predictibles, i stakeholders enganxats a tot el value stream.

Quatre caselles. Però si les mires de prop, totes apunten al mateix lloc. No són quatre requisits independents: són quatre cares d'un sol substrat. Totes quatre tracten de fer el context de la teva organització llegible i fiable perquè una màquina hi pugui raonar a sobre. La visió clara és context sobre el què. L'entorn estàndard és context sobre el com. L'estructura de requisit a codi és context en un format que l'agent pot consumir sense interpretar. I els stakeholders enganxats són la garantia que aquest context no es desincronitza de la realitat a mitja setmana. McKinsey ho ven com una llista; a la trinxera és una sola cosa, i té nom.

El knowledge graph és la capa de memòria de la IA

Aquí és on l'article diu la cosa de debò interessant, i és la que t'hauries d'emportar a casa. Les empreses que van al davant estan construint knowledge graphs que funcionen com una capa de memòria d'IA a través de tot el cicle de vida del software, un per domini: connecten el feedback de client, els registres de decisions d'arquitectura, els documents de disseny, els tiquets, l'activitat de GitHub, els informes d'incidents i les regles de compliance.

La paraula clau és connecten. Un sistema de RAG sobre un wiki — del qual ja vaig parlar per als que integren LLMs — et recupera el paràgraf que casa amb les paraules de la pregunta. Útil, però pla. Una capa de memòria de debò sap una altra cosa: sap que aquest incident va provocar aquell registre de decisió, que restringeix aquest servei, l'amo del qual va escriure aquella regla de compliance. El valor no és als nodes, és a les arestes. La diferència entre les dues coses és la diferència entre un agent que et cita el wiki i un agent que respecta les teves cicatrius.

I aquesta és exactament la capa que argumentava que era el fossat: el model converteix en mercaderia el 80% fàcil, i la diferenciació es trasllada al sistema que l'envolta. La memòria de com funciona de debò la teva empresa és la part d'aquest sistema que cap proveïdor de models et pot vendre, perquè no la té.

Ja hem encodat coneixement tribal abans, i ho vam dir-ne infraestructura com a codi

Si això et sona, és perquè els que venim d'operacions ja hem fet aquest moviment unes quantes vegades. Cada salt cap a l'autonomia, sense excepció, ha estat el mateix gest: agafar coneixement que vivia al cap d'un enginyer sènior i codificar-lo perquè una màquina hi pogués actuar a sobre.

Els runbooks a mà van passar a remediació automàtica. Els passos de desplegament que sabia el de sempre van passar a un pipeline de CI/CD. El «pregunta-li a la Maria, que ella sap com està cablejada la producció» va passar a infraestructura com a codi. I el detall que tothom oblida: el pipeline no es va posar a córrer sol perquè les eines es van fer llestes. Es va posar a córrer sol quan vam escriure el que sabia la Maria. Els agents enviant software de nit són exactament aquesta lliçó un pis més amunt. L'agent executa sense supervisió fins exactament on el context que té li ho permet, i ni un pas més. El substrat no és cap màgia nova; és coneixement tribal, finalment escrit en un format que una màquina pot recórrer.

El lliurament 24 hores és el premi, no l'objectiu

Per això la cadència diària que ven McKinsey és real, però va darrere del substrat, no davant. L'execució nocturna funciona fins on la memòria de l'agent el deixa arribar sol; passada aquella línia, s'atura i espera un humà. Així que la mètrica que importa no és «els agents poden córrer de nit», sinó fins on arriba l'agent abans de topar amb una pregunta que només una persona pot respondre — i cada una d'aquestes aturades és un bug de context a la teva capa de memòria, no una falla del model.

Aquí m'has de deixar concedir el contraargument fort, perquè és bo: «els models milloren cada trimestre, les finestres de context creixen, no s'ho menjarà tot això el proper model?». En part, sí. Part de l'andamiatge d'avui quedarà absorbit: models millors necessiten menys que els agafis de la mà, i finestres més grans s'empassen més documents d'un sol cop. Però una finestra de context no és una memòria. Enganxar tot el wiki al prompt no fa que el model sàpiga quin pas no s'ha de saltar mai; fa que llegeixi una pila de text potser contradictori i endevini. Saber demana curació, verificació, frescor i resolució de conflictes: decidir quina de dues fonts que es contradiuen és la veritat vigent avui. Això és criteri, ho fa un humà, i és feina d'enginyeria permanent. El model és de lloguer i idèntic per al de davant. La memòria curada de com funciona la teva empresa és la part que ningú pot llogar.

Què faria jo aquest trimestre si fos el teu CTO

Cinc apostes concretes, perquè el diagnòstic sense acció és només una opinió maca:

  1. Localitza on viu de debò el teu context. Abans de comprar cap «fàbrica d'agents», fes l'inventari incòmode: quant del coneixement que un agent necessitaria per enviar codi viu només en caps, en fils de Slack i en un wiki caducat? Aquesta resposta és el teu coll d'ampolla. No el model.
  2. Construeix la memòria d'UN domini, no de tota l'empresa. El knowledge graph de tot el SDLC d'un sol cop és un projecte que mor en comitè. Tria un domini amb dolor real, connecta'n els registres de decisió, els tiquets, els incidents i les regles de compliance, i fes que un agent hi raoni a sobre. Aprèn allà abans d'escalar.
  3. Estandarditza el camí de requisit a codi. És la condició de McKinsey que de debò mou l'agulla. Si cada feature entra en un format diferent, l'agent endevina; si entra en una estructura predictible, executa. Inputs reproduïbles abans que outputs autònoms.
  4. Hornea el compliance dins de la memòria, no al final. Les regles de risc, legal i seguretat han de ser nodes que l'agent llegeix mentre construeix, no una porta que algú obre quan ja està tot fet. Un control que viu al graf millora la traçabilitat i la completesa; un control que viu en un PDF és un coll d'ampolla amb cara de persona.
  5. Mesura l'autonomia per com de lluny arriba l'agent sol. Oblida't del «percentatge de codi escrit per IA». La mètrica honesta és quants passos encadena un agent abans de necessitar un humà, i tractar cada aturada com un bug de context que s'arregla al substrat — no com un sostre del model.

La línia que defenso és la de sempre, i aquí la IA l'il·lustra de la manera més literal que he vist mai: no substitueix l'enginyer, l'apalanca. Algú ha de decidir quina de dues fonts contradictòries és la veritat, quin pas no es salta mai, quan un coneixement ha caducat. Aquesta feina — construir i mantenir la memòria de com funciona de debò la teva empresa — no la fa el model. La fa un enginyer amb criteri. I com més autònoms vols els agents, més en necessites, no menys.

McKinsey ven el destí: agents que envien software mentre dorms. Té raó que és possible. El que la diapositiva s'estalvia és que el motor barat i intercanviable mai ha estat el problema. El problema, com sempre, és tot el cotxe que l'envolta — i aquesta vegada, la peça més difícil de construir es diu memòria.


Estàs intentant que els teus agents passin de la demo a producció i el que se't desincronitza és el context, no el model? Parla amb un CTO sobre muntar l'squad nearshore que et construeixi la capa de memòria, no només que connecti l'agent.

Preparat per construir el teu equip d'enginyeria?

Parla amb un partner tècnic i desplega desenvolupadors validats per CTOs en 72 hores.