Reptes

Garanties de grau financer per a la IA agèntica: el risc de monocultiu i el Heterogeneity Score

Per Marc Molas·30 de març del 2026·12 min de lectura

La major part del debat sobre governança d'IA tracta la seguretat com una propietat d'un sistema individual. Els bancs i les asseguradores no es poden permetre aquest luxe. Quan la IA agèntica entra en fluxos de treball financers — decisions de crèdit, execució d'operacions, gestió de sinistres, revisió AML — la superfície de risc no inclou només el mode de fallada de cada agent, sinó el mode de fallada sistèmic: molts agents en moltes institucions, tots sobre la mateixa família de models, prenent alhora les mateixes males decisions correlacionades, reaccionant a la mateixa distribució de prompts.

No és cap hipòtesi. És el mateix risc de fallades correlacionades que fa dues dècades va portar els reguladors a preocupar-se pel monocultiu de models en les finances quantitatives. Un paper recent, Finance-Grade Assurance for Agentic AI (Fradelos, gener de 2026), agafa el patró de governança verificable i l'estén explícitament als fluxos financers d'alt risc. Les aportacions principals: un sistema de control per capes que el paper anomena FG-VGA, i una mètrica operativa, el Heterogeneity Score (HS), que tracta el monocultiu de models com un risc auditable de ple dret.

L'he llegit des del seient de qui construeix, no des del de l'analista: porto anys operant sistemes en producció on la primera pregunta després d'un incident és «què ha fet exactament el sistema, i ho pots demostrar?». Aquest és el paper que posaria davant de qualsevol CTO d'una institució financera que estigui desplegant agents en qualsevol àmbit que importi als reguladors. I és útil molt més enllà de les finances, perquè el patró arquitectònic es generalitza.

«Grau financer» és una forma, no un grau de rigor

Les garanties de grau financer no són simplement una governança «més rigorosa». Són una forma concreta que els règims de supervisió (gestió del risc de model, resiliència operativa, les inquietuds de risc sistèmic de l'ESRB i l'FSB) exigeixen de debò. El paper identifica quatre propietats que solen faltar als enfocaments actuals de governança d'IA:

Portes de política verificables per màquina per a les accions dels agents — no «se suposa que el model segueix aquesta política», sinó «el runtime no pot executar l'acció si la verificació de política no passa».
Evidence packets que lliguen intenció, tool calls i resultats — cada acció produeix un registre signat que vincula la intenció declarada de l'agent, la crida real a l'eina i el resultat observat. Reconstruïble. Que delata qualsevol manipulació.
Controls de desplegament lligats a l'atestació — els agents només s'executen en entorns d'execució atestats. L'evidence packet enllaça amb l'atestació, de manera que un auditor pot verificar que una acció concreta la va executar el codi esperat sobre el hardware esperat.
Una mètrica operativa que tracta el comportament correlacionat dels agents com un risc de ple dret — no només el risc per agent, sinó el risc sistèmic que molts agents convergeixin en la mateixa resposta perquè comparteixen el mateix model subjacent.

Els tres primers punts són extensions del patró arquitectònic de governança verificable. El quart és l'aportació genuïnament nova.

El Heterogeneity Score fa auditable el monocultiu

El Heterogeneity Score (HS) és una mètrica auditable i exigible de quanta diversificació de models i de proveïdors hi ha en un desplegament agèntic concret. La intenció és operacionalitzar el que fins ara era una inquietud difusa en el debat sobre risc d'IA: si la IA agèntica de tots els bancs per a decisions de crèdit s'aguanta sobre els mateixos dos models fundacionals, el mode de fallada d'aquests models esdevé sistèmic.

L'HS es calcula sobre el desplegament agèntic en qüestió i actua com a condició d'autorització. Per sobre del llindar, el desplegament queda autoritzat. Per sota, es bloqueja o exigeix una acceptació explícita del risc per part d'un responsable sènior.

Tres coses fan que l'HS sigui pràctic:

És mesurable

L'HS es construeix a partir d'entrades concretes: les famílies de models en ús, els proveïdors, la correlació del comportament dels agents sobre una distribució de referència. Són quantitats auditables. No són perfectes — mesurar amb rigor la correlació de comportament entre models és difícil — però són prou concretes per condicionar-hi una porta de desplegament.

És una porta de desplegament, no una mètrica d'informe

Aquí hi ha la diferència operativa. La majoria de requisits de «diversitat» dels marcs de risc d'IA són requisits d'informació: descrius què fas, el regulador ho revisa i el desplegament tira endavant. L'HS és una porta: el runtime de desplegament comprova la puntuació i es nega a continuar si queda per sota del llindar. La negativa és una propietat del sistema, no del judici humà.

Encaixa amb les preocupacions de risc sistèmic que els reguladors ja posen sobre la taula

L'ESRB, l'FSB, la FINMA i d'altres fa temps que alerten del monocultiu de models en la IA financera. L'HS està pensat per ser la mètrica concreta que els supervisors poden examinar, en lloc de l'afirmació vaga que «treballem amb diversos proveïdors».

La seguretat no és un escalar: les quatre monedes auditables

El moviment arquitectònic més profund del paper és descompondre la seguretat en quatre «monedes» auditables:

Seguretat probabilística: amb quina probabilitat el sistema violarà els límits de seguretat, amb evidència quantitativa.
Seguretat energètica i de còmput: el cost en recursos d'operar el sistema, incloent-hi els pics de càrrega i la demanda correlacionada.
Seguretat epistèmica: la integritat del coneixement del sistema — sap què sap, marca la incertesa, contrasta les fonts.
Seguretat social i ambiental: les externalitats d'operar el sistema — equitat, petjada ambiental, impacte social.

Cada moneda té la seva pròpia metodologia de mesura, el seu format d'evidència i la seva cadència d'auditoria. El pipeline de governança les recombina en una decisió d'autorització de desplegament.

Aquesta descomposició importa perquè les quatre monedes no es compensen entre elles de manera neta. Un sistema pot ser probabilísticament segur i un malbaratador d'energia. Pot ser epistèmicament rigorós i socialment nociu. Tractar la «seguretat de la IA» com un únic escalar amaga aquests compromisos. Tractar-la com quatre monedes comptabilitzades per separat els fa explícits i auditables.

Què conté realment un evidence packet

L'evidence packet és la unitat de registre auditable. Per a cada acció d'un agent amb rellevància regulatòria, el packet ha de lligar:

Intenció: l'objectiu declarat de l'agent per a l'acció, extret de la seva traça de raonament.
Context d'autorització: les decisions de política avaluades, el nivell de seniority de l'agent, les aprovacions multipart (si n'hi ha).
Tool call: la invocació exacta de l'eina, els paràmetres, el sistema de destinació.
Estat previ a l'acció: què era cert abans d'actuar.
Resultat: què ha retornat l'eina i quin estat ha canviat.
Estat posterior a l'acció: què és cert després.
Punter d'atestació: una referència criptogràfica a l'atestació del runtime (l'agent s'ha executat amb aquest codi, sobre aquest hardware, amb aquesta configuració).

El Watchdog signa aquests packets, que s'emmagatzemen en un evidence store immutable i queden a disposició dels auditors interns i externs sota demanda. Esdevenen el substrat del compliment normatiu: no «confiem que l'agent es comportarà», sinó «aquí tens el registre signat criptogràficament del que l'agent ha fet realment».

Per què cal actualitzar la gestió del risc de model

Els marcs de gestió del risc de model (MRM) existents es van dissenyar per a models predictius. El model és un artefacte fix: el valides, en monitores la deriva i el revalides periòdicament. La IA agèntica trenca aquest patró per dos costats:

El comportament de l'agent canvia amb el context. El mateix model pot emprendre accions diferents segons el prompt, l'historial de la conversa, les eines disponibles o el rol de l'usuari. Un MRM que valida «el model» no et diu què farà l'agent.
La superfície de risc té forma d'acció, no de predicció. Els models predictius produeixen sortides sobre les quals després actuen les persones. Els agents produeixen accions directament. El risc dels agents és risc d'acció, no de predicció. Als marcs MRM dissenyats per al risc de predicció se'ls escapa la unitat rellevant.

El patró FG-VGA aborda totes dues coses: la validació es fa al nivell de política i autorització, no al nivell de model; el monitoratge es fa sobre distribucions d'accions, no de sortides; i l'evidence store immutable proporciona el registre per acció que exigeix la gestió del risc a nivell d'acció.

Què haurien d'estar fent els CTO de les institucions financeres

Tres coses que jo faria aquest trimestre si dirigís l'enginyeria d'una institució financera que està desplegant IA agèntica:

1. Adopta els evidence packets a nivell d'acció, ara

Tant si el teu regulador ho exigeix avui com si no, incorpora la generació d'evidence packets al runtime de l'agent. He hagut d'encaixar traçabilitat d'auditoria en sistemes que ja eren vius, i és una feina ingrata: el cost és dràsticament més alt que construir-la des del primer dia. Només el valor intern — depuració, anàlisi d'incidents, avaluació de capacitats — ja sol justificar el cost.

2. Mesura el teu Heterogeneity Score, encara que sigui informalment

Encara que no formalitzis el càlcul de l'HS, audita la diversificació dels teus models. Si l'agent de detecció de frau, el d'AML, el de KYC i el d'atenció al client funcionen tots sobre el mateix model fundacional del mateix proveïdor, tens un risc de monocultiu sense mesurar. La mitigació pràctica és diversificar entre famílies de models.

3. Prepara't per a l'atestació

La computació confidencial i l'atestació remota encara no són habituals en els desplegaments d'IA en producció, però la direcció regulatòria és clara. La IA agèntica en fluxos regulats necessitarà execució atestable d'aquí a pocs anys. Encaminar el desplegament cap a l'atestació ara surt molt més barat que refer-ho després.

El patró viatja més enllà de les finances

El patró es generalitza molt més enllà de les finances. Qualsevol sector amb:

accions irreversibles d'alt risc (salut, àmbit legal, infraestructures)
requisits de rendició de comptes davant del regulador (utilities, assegurances, serveis públics)
risc sistèmic de fallades correlacionades (allà on un error d'IA a escala provoca danys en cascada)

…es beneficia de la mateixa arquitectura. El concepte de Heterogeneity Score s'aplica a qualsevol desplegament on molts operadors independents puguin convergir en el mateix model. El patró d'evidence packets, a qualsevol desplegament on importi la reconstrucció post-incident. La descomposició en quatre monedes, allà on la seguretat no sigui un escalar.

Les garanties de grau financer són, a la pràctica, la versió amb el llistó més alt de la governança d'IA agèntica. Les versions de llistó mitjà s'hi assemblen molt, amb cadències d'auditoria més relaxades i requisits d'atestació més lleugers. Els CTO que construeixen per al llistó alt acaben amb una infraestructura que serveix automàticament per al llistó mitjà. Construir només per al llistó mitjà sol implicar refer-ho tot quan el llistó puja.

I el llistó està pujant. Les finances només són de les primeres a notar-ho.

Font: Fradelos, G. Finance-Grade Assurance for Agentic AI: Verifiable Governance, Systemic Risk Mitigation, and Sustainability/Compute Accounting Architecture for banks, insurers, and major financial services providers (Ginebra, 11 de gener de 2026). SSRN 6306980.

Estàs desplegant IA agèntica en un entorn regulat i necessites capacitat d'enginyeria que ja treballa amb atestació, evidence packets i desplegaments conscients de l'heterogeneïtat? Parla amb un CTO sobre desplegar un squad nearshore amb la disciplina que exigeix la feina de grau financer.