Retos

Aseguramiento de grado financiero para la IA agéntica: el riesgo de monocultivo, por fin medible

Por Marc Molas·30 de marzo de 2026·12 min de lectura

Casi todo el debate sobre gobernanza de IA trata la seguridad como una propiedad de un sistema individual. Los bancos y las aseguradoras no pueden permitirse ese lujo. Cuando la IA agéntica entra en producción en flujos financieros — decisiones de crédito, ejecución de órdenes, tramitación de siniestros, revisión AML — la superficie de riesgo no incluye solo el modo de fallo de cada agente, sino el modo de fallo sistémico: muchos agentes en muchas instituciones, todos sobre la misma familia de modelos, todos tomando las mismas malas decisiones correlacionadas a la vez, todos reaccionando a la misma distribución de prompts.

No es una hipótesis. Es el mismo riesgo de fallo correlacionado que hace dos décadas llevó a los reguladores a preocuparse por el monocultivo de modelos en las finanzas cuantitativas. Un paper reciente, Finance-Grade Assurance for Agentic AI (Fradelos, enero de 2026), toma el patrón de gobernanza verificable y lo extiende explícitamente a los flujos financieros de alto riesgo. Sus contribuciones principales: un sistema de control por capas que el paper llama FG-VGA, y una métrica operativa, el Heterogeneity Score (HS), que trata el monocultivo de modelos como un riesgo auditable de primera clase.

Lo he leído desde el asiento de quien construye, no del analista: llevo años operando sistemas en producción donde la primera pregunta tras un incidente es «¿qué hizo exactamente el sistema, y puedes demostrarlo?». Es el paper que pondría delante de cualquier CTO de una institución financiera que esté metiendo agentes en cualquier cosa que importe a los reguladores. Y es útil mucho más allá de las finanzas, porque el patrón arquitectónico generaliza bien.

«Grado financiero» es una forma, no un nivel de rigor

El aseguramiento de grado financiero no es una gobernanza «más rigurosa» sin más. Es una forma concreta que los regímenes supervisores (gestión de riesgo de modelo, resiliencia operativa, las preocupaciones de riesgo sistémico de ESRB y FSB) exigen de verdad. El paper identifica cuatro propiedades de las que los enfoques actuales de gobernanza de IA suelen carecer:

Gating de políticas verificable por máquina para las acciones agénticas — no «se supone que el modelo sigue esta política», sino «el runtime no puede ejecutar la acción si la verificación de política no pasa».
Evidence packets que ligan intención, tool calls y resultados — cada acción produce un registro firmado que une la intención declarada del agente, el tool call real y el resultado observado. Reconstruible. A prueba de manipulación.
Controles de despliegue ligados a atestación — los agentes solo corren en entornos de ejecución atestados. El evidence packet enlaza con la atestación, de modo que un auditor puede verificar que una acción la ejecutó el código esperado en el hardware esperado.
Una métrica operativa que trata el comportamiento correlacionado de los agentes como riesgo de primera clase — no solo el riesgo por agente, sino el riesgo sistémico de que muchos agentes converjan en la misma respuesta porque comparten el mismo modelo subyacente.

Las tres primeras son extensiones del patrón arquitectónico de gobernanza verificable. La cuarta es la contribución genuinamente nueva.

El Heterogeneity Score hace auditable el monocultivo

El Heterogeneity Score (HS) es una métrica auditable y exigible de cuánta diversificación de modelos y de proveedores existe en un despliegue agéntico dado. La intención es operacionalizar lo que hasta ahora era una preocupación difusa en el debate sobre riesgo de IA: si la IA agéntica de todos los bancos para decisiones de crédito se construye sobre los mismos dos modelos de fundación, el modo de fallo de esos modelos se vuelve sistémico.

El HS se calcula sobre el despliegue agéntico en cuestión y actúa como condición de autorización. Por encima del umbral, el despliegue se permite. Por debajo, el despliegue se bloquea o exige una aceptación de riesgo explícita por parte de un responsable senior con nombre y apellidos.

Tres cosas hacen que el HS sea práctico:

Es medible

El HS se construye a partir de entradas concretas: el conjunto de familias de modelos en uso, el conjunto de proveedores, la correlación del comportamiento de los agentes sobre una distribución de benchmark. Son cantidades auditables. No son perfectas — medir con rigor la correlación de comportamiento entre modelos es difícil — pero son lo bastante concretas como para condicionar un despliegue.

Es una condición bloqueante de despliegue, no una métrica de reporting

Aquí está la diferencia operativa. La mayoría de los requisitos de «diversidad» en los marcos de riesgo de IA son requisitos de reporting: describes lo que haces, el regulador lo revisa, el despliegue sigue adelante. El HS es una barrera: el runtime de despliegue comprueba la puntuación y se niega a continuar si está por debajo del umbral. La negativa es una propiedad del sistema, no del juicio humano.

Encaja con preocupaciones de riesgo sistémico que los reguladores ya están planteando

ESRB, FSB, FINMA y otros llevan tiempo señalando su preocupación por el monocultivo de modelos en la IA financiera. El HS está diseñado para ser la métrica concreta que los supervisores pueden examinar, en lugar de la afirmación vaga de que «trabajamos con varios proveedores».

La seguridad no es un escalar: las cuatro monedas auditables

El movimiento arquitectónico más profundo del paper es descomponer la seguridad en cuatro «monedas» auditables:

Seguridad probabilística: la probabilidad de que el sistema viole sus límites de seguridad, con evidencia cuantitativa.
Seguridad energética y de cómputo: el coste en recursos de operar el sistema, incluyendo picos de carga y demanda correlacionada.
Seguridad epistémica: la integridad del conocimiento del sistema — si sabe lo que sabe, si señala la incertidumbre, si contrasta sus fuentes.
Seguridad social y ambiental: las externalidades de operar el sistema — equidad, huella ambiental, impacto social.

Cada moneda tiene su propia metodología de medición, su formato de evidencia y su cadencia de auditoría. El pipeline de gobernanza las recompone en una decisión de autorización de despliegue.

Esta descomposición importa porque las cuatro monedas no se compensan entre sí de forma limpia. Un sistema puede ser probabilísticamente seguro y un derroche energético. Puede ser epistémicamente riguroso y socialmente dañino. Tratar la «seguridad de la IA» como una única métrica escalar oculta esos trade-offs. Tratarla como cuatro monedas contabilizadas por separado los hace explícitos y auditables.

Qué contiene de verdad un evidence packet

El evidence packet es la unidad de registro auditable. Para cada acción de agente con relevancia regulatoria, el packet debe ligar:

Intención: el objetivo declarado del agente para la acción, derivado de su traza de razonamiento.
Contexto de autorización: las decisiones de política evaluadas, el nivel de seniority del agente, las firmas multiparte (si las hay).
Tool call: la invocación exacta de la herramienta, sus parámetros, el sistema objetivo.
Estado previo a la acción: qué era cierto antes de actuar.
Resultado: qué devolvió la herramienta y qué estado cambió.
Estado posterior a la acción: qué es cierto después.
Puntero de atestación: una referencia criptográfica a la atestación del runtime (el agente corrió con este código, en este hardware, con esta configuración).

Estos packets los firma el Watchdog, se almacenan en un evidence store inmutable y quedan a disposición de los auditores internos y externos bajo demanda. Se convierten en el sustrato del cumplimiento: no «confiamos en que el agente se comporte», sino «aquí está el registro firmado criptográficamente de lo que el agente hizo de verdad».

Por qué la gestión de riesgo de modelo necesita una actualización

Los marcos existentes de gestión de riesgo de modelo (MRM) se diseñaron para modelos predictivos. El modelo es un artefacto fijo: lo validas, lo monitorizas por si deriva, lo revalidas periódicamente. La IA agéntica rompe este patrón de dos maneras:

El comportamiento del agente cambia con el contexto. El mismo modelo puede tomar acciones distintas según el prompt, el historial de conversación, las herramientas disponibles o el rol del usuario. Un MRM que valida «el modelo» no te dice qué hará el agente.
La superficie de riesgo tiene forma de acción, no de predicción. Los modelos predictivos producen salidas sobre las que después actúan personas. Los agentes producen acciones directamente. El riesgo de los agentes es riesgo de acción, no de predicción. Los marcos MRM diseñados para riesgo de predicción no capturan la unidad relevante.

El patrón FG-VGA aborda las dos: la validación se hace a nivel de política y autorización, no de modelo; la monitorización se hace sobre distribuciones de acciones, no de salidas; y el evidence store inmutable proporciona el registro por acción que exige la gestión de riesgo a nivel de acción.

Qué deberían estar haciendo los CTO de las instituciones financieras

Tres cosas que haría este trimestre si dirigiera la ingeniería de una institución financiera que está desplegando IA agéntica activamente:

1. Adopta los evidence packets a nivel de acción ya

Lo exija tu regulador hoy o no, incorpora la generación de evidence packets al runtime del agente. He tenido que añadir trazas de auditoría a sistemas que ya estaban vivos, y es un trabajo penoso — el coste es dramáticamente mayor que construirlas desde el primer día. Solo el valor interno — debugging, análisis de incidentes, evaluación de capacidades — suele justificar el coste.

2. Mide tu Heterogeneity Score, aunque sea de manera informal

Aunque no formalices el cálculo del HS, audita tu diversificación de modelos. Si tu agente de detección de fraude, tu agente de AML, tu agente de KYC y tu agente de atención al cliente corren todos sobre el mismo modelo de fundación del mismo proveedor, tienes un riesgo de monocultivo sin medir. Diversificar entre familias de modelos es la mitigación práctica.

3. Planifica la atestación

La computación confidencial y la atestación remota todavía no son habituales en los despliegues de IA en producción, pero la dirección regulatoria es clara. La IA agéntica en flujos regulados necesitará ejecución atestable en los próximos años. Construir hoy hacia un despliegue preparado para atestación sale mucho más barato que adaptarlo después.

El patrón viaja más allá de las finanzas

El patrón generaliza mucho más allá de las finanzas. Cualquier sector con:

Acciones irreversibles de alto riesgo (sanidad, legal, infraestructura)
Requisitos regulatorios de rendición de cuentas (utilities, seguros, servicios públicos)
Preocupaciones de fallo sistémico correlacionado (cualquier sitio donde un error de IA a escala provoque daños en cascada)

…se beneficia de la misma arquitectura. El concepto del Heterogeneity Score aplica a cualquier despliegue donde muchos operadores independientes puedan converger en el mismo modelo. El patrón de evidence packet aplica a cualquier despliegue donde importe la reconstrucción post-incidente. La descomposición en cuatro monedas aplica allí donde la seguridad no sea un escalar.

El aseguramiento de grado financiero es, en la práctica, la versión más exigente de la gobernanza de IA agéntica. Las versiones intermedias se le parecen mucho, con cadencias de auditoría más relajadas y requisitos de atestación más ligeros. Los CTO que construyen para el listón alto acaban con una infraestructura que sirve para el listón medio sin esfuerzo adicional. Construir solo para el listón medio suele exigir una reconstrucción cuando el listón sube.

Y el listón está subiendo. Las finanzas solo van por delante.

Fuente: Fradelos, G. Finance-Grade Assurance for Agentic AI: Verifiable Governance, Systemic Risk Mitigation, and Sustainability/Compute Accounting Architecture for banks, insurers, and major financial services providers (Ginebra, 11 de enero de 2026). SSRN 6306980.

¿Estás llevando IA agéntica a un entorno regulado y necesitas capacidad de ingeniería que ya construye con atestación, evidence packets y despliegue consciente de la heterogeneidad? Habla con un CTO sobre desplegar un squad nearshore con la disciplina que exige el trabajo de grado financiero.