strategy

La UE quiere certificar la IA antes de lanzarla. La IA no falla antes, falla después.

Por Marc Molas·16 de junio de 2026·10 min de lectura

Cualquier ingeniero que haya tenido un sistema en producción a gran escala ha aprendido la misma lección humilde: no puedes demostrar que un sistema complejo es seguro antes de que se ejecute. Lo revisas, lo pruebas, razonas todos los caminos que se te ocurren… y aun así te sorprende en producción, porque la producción es justo donde aparecen las entradas que nunca imaginaste. Por eso dejamos de fingir. Instrumentamos el sistema, lo vigilamos y entrenamos los reflejos para reaccionar cuando hace algo que no habíamos previsto. La Unión Europea regula la IA como si fuera al revés.

El 11 de junio, Bruegel publicó un policy brief de Mario Mariniello —The right balance: how to fix European Union artificial intelligence regulation— que dice, con el lenguaje medido de un think tank de Bruselas, más o menos lo que te diría un SRE tras una mala noche de guardia: la Ley de IA apuesta demasiado por demostrar la seguridad antes del despliegue y demasiado poco por detectar el daño después. Y le pone precio a la apuesta. Citando a Haataja y Bryson, Mariniello calcula el cumplimiento de un sistema de IA medio entre 14.623 € y 29.277 €: entre el 9 % y el 17 % de un presupuesto de desarrollo de 170.000 €. Léelo en dinero: de cada euro que gastas en construir un sistema de IA, entre 9 y 17 céntimos se van en demostrar que cumple, antes de que llegue a un solo usuario.

Pongo en producción sistemas de IA que caen bajo este régimen, y antes pasé años haciendo DevOps y respuesta a incidentes, donde todo el trabajo vivía en el hueco entre lo que habíamos firmado y lo que de verdad ocurría a las tres de la madrugada. En Conectia construimos nuestra preselección de talento siguiendo las reglas de alto riesgo de la Ley de IA antes de que la ley nos alcanzara así que no soy alguien de fuera quejándose del papeleo. He pagado esta factura a propósito. Mi problema no es que Europa regule la IA. Es que concentra todo el rigor en el único día en que menos sabe.

No puedes certificar un sistema cuyo comportamiento se descubre después de lanzarlo

La Ley de IA clasifica los sistemas por su finalidad prevista en el momento de ponerlos en el mercado, y demuestra la seguridad sobre todo con papeleo de conformidad presentado antes del lanzamiento. Pero la IA no se queda quieta para la foto. La mayoría de las capacidades reales de un modelo —y sus formas reales de fallar— se descubren tras el despliegue (el informe se apoya en Bengio et al., 2024, y cualquiera que haya lanzado una función con un LLM ya lo sabe en los huesos). Un sistema que el día del lanzamiento es de riesgo mínimo pasa a ser de alto riesgo en cuanto un usuario hace algo que el desarrollador no previó ni controla.

Las pruebas se acumulan justo en la categoría que la Ley deja pasar como riesgo bajo: los chatbots. Un estudio de mayo de 2026 sobre consultas electorales en Escocia halló que el 34,1 % de las respuestas de los chatbots de IA contenían errores factuales sobre cómo votar. En Nevada, cuatro de cada cinco chatbots probados dieron información incorrecta sobre el censo electoral. Y en agosto de 2025, Raine contra OpenAI llevó ante un tribunal de San Francisco el papel de un chatbot en el suicidio de un adolescente. Ninguno de estos daños es algo que una lista de comprobación previa al lanzamiento hubiera podido frenar, porque ninguno existía en el momento del lanzamiento. La conformidad ex ante certifica una fotografía. El sistema es una película.

De esta película ya nos salimos, se llama cascada

Los ingenieros ya hicimos este experimento exacto, y nos fuimos. Durante años intentamos certificar que una versión era correcta antes de publicarla: aprobaciones, comités de cambios, una puerta que cruzabas una vez y luego rezabas. Renunciamos a ello, no porque nos volviéramos temerarios, sino porque la demostración nunca podía seguir el ritmo del cambio. Todo el movimiento DevOps y SRE consistió, precisamente, en trasladar el rigor de antes de la versión a alrededor del sistema en marcha: observabilidad, error budgets, rollback, postmortems sin culpables. No dejamos de preocuparnos por la seguridad. La movimos a donde vive de verdad el riesgo.

Infraestructura de detección inspirada en el sistema Sentinel de la FDA: muestrea el tráfico real, vigila eventos adversos casi en tiempo real. Un sistema de notificación no punitiva de cuasi-incidentes inspirado en el de la aviación —el Aviation Safety Reporting System, en marcha desde 1976—, que es un postmortem sin culpables a escala de toda una industria. Y una taxonomía de incidentes estandarizada con un registro público, sobre el marco de la OCDE de 2025, para que todo el mercado aprenda de cada fallo una sola vez, en lugar de que cada empresa lo aprenda a base de golpes. Instrumentar, notificar, responder. Confío en este enfoque por una razón de lo más aburrida: es como ya gestiono todo aquello de lo que soy responsable.

La factura por adelantado regala el mercado a los de siempre

Cargar el coste al principio tiene un segundo problema, y no tiene nada que ver con la seguridad: tiene que ver con quién queda en pie. Esa factura de cumplimiento no se encoge. Quince o treinta mil euros más un sistema de gestión de la calidad son una cifra insignificante para una empresa grande y un muro para una startup de dos personas. El RGPD contribuyó a la concentración del mercado porque cargaba desproporcionadamente a las empresas pequeñas. Así, un régimen vendido como protección de las personas frente a la IA poderosa puede acabar, calladamente, protegiendo a las empresas de IA poderosas frente a la competencia.

Hay una solución que toma prestado de la Ley de Servicios Digitales: graduar la carga según el alcance del despliegue. Un nivel de auditoría ligera para las pymes —menos de 50 millones de euros de facturación, o menos de 100.000 personas afectadas— y solo para usos de daño reversible; un nivel estándar en medio; y un nivel intenso para los gigantes —más de 150 millones o más de un millón de personas afectadas— donde la evaluación por terceros es obligatoria y se acaba la autocertificación. Ajustar el escrutinio al radio de la explosión, en vez de apuntar una sola puerta a todo el mundo. Y conviene mirar quién haría hoy el trabajo de detectar: más de 2.000 autoridades nacionales de vigilancia del mercado, la mayoría pensadas para inspeccionar productos físicos, frente a una Oficina de IA de unos 125 efectivos: el tipo de fragmentación en la aplicación que ya lastra las normas tecnológicas europeas. El aparato pensado para atrapar un algoritmo peligroso se diseñó, en buena parte, para atrapar una tostadora peligrosa.

«Lanzar y vigilar» también es una manera excelente de dejar que el daño ocurra primero

Aquí viene la objeción más fuerte, y no la voy a esquivar: la vigilancia ex post puede sonar a «moverse rápido y romper cosas» con bendición regulatoria. Y el coste es real y feo: el ex post significa que a veces el daño ocurre antes de que llegue la respuesta. Un registro de incidentes no hace nada por el adolescente del caso Raine. Unas elecciones envenenadas por la desinformación de un chatbot no se revierten como un mal despliegue. Quien te venda la mera vigilancia a posteriori como una mejora limpia te está ocultando esa cifra, y no deberías permitírselo.

Pero esa no es la propuesta, y el eje que lo resuelve es la irreversibilidad. No vigilas-y-respondes ante un diagnóstico médico o un coche autónomo: ahí la puerta se queda al principio, y Mariniello mantiene la responsabilidad objetiva para los sistemas prohibidos y de alto riesgo precisamente porque el daño puede ser grave y definitivo. El nivel ligero queda explícitamente reservado al daño reversible —empleo, scoring crediticio—, no a los diagnósticos ni a los vehículos autónomos. Así que la tesis real no es «ex ante malo, ex post bueno». Es poner puerta a lo que no se puede deshacer; instrumentar lo que sí.

Y una última advertencia honesta, porque va en contra de toda la idea: el ex post solo funciona si la detección es real. La propia aplicación a posteriori del RGPD fue fragmentada y débil. Si Europa traslada la carga al «después» y luego infrafinancia ese «después» —125 personas, 2.000 autoridades mal emparejadas y, todavía, ningún marco de responsabilidad específico para la IA—, no habrá reequilibrado nada. Habrá desregulado y lo habrá llamado vigilancia. Mariniello tiene un nombre para la versión global de ese deslizamiento: «desregulación mutuamente asegurada». La pieza de responsabilidad es crucial: quitarle la carga de la prueba a la víctima —con una presunción refutable de defecto para los sistemas ordinarios— para que un usuario perjudicado no tenga que hacer ingeniería inversa de un modelo que no puede ver. La Directiva de responsabilidad por productos defectuosos no se aplica hasta el 9 de diciembre de 2026. Hasta que no haya a la vez detección financiada y responsabilidad real, «ex post» es solo una forma más bonita de decir «no vigila nadie».

Qué montaría en mi stack de IA tire Bruselas hacia donde tire

Lo bueno del instrumental ex post de Mariniello es que la mayor parte no es más que buena ingeniería que deberías tener como tuya, al margen de la ley. Si este trimestre tuviera que montar —o auditar— un producto de IA, este es el trabajo, y nada de esto espera a ninguna regulación:

Dibuja la cadena de responsabilidad antes de lanzar, no después de la demanda. Para cada función de IA, escribe quién responde cuando le hace daño a un usuario: tú, el proveedor del modelo, la fuente de datos. El ejemplo de Mariniello de la hipoteca denegada injustamente —banco, desarrollador, proveedor del LLM, proveedor de los datos de entrenamiento, todos señalándose— es tu RACI de incidentes. Si esa casilla está vacía, el acusado por defecto eres tú.
Lleva ya tu propio registro de incidentes. Adopta la taxonomía de incidentes de la OCDE y registra hoy mismo cada fallo de IA. No esperes a un registro europeo obligatorio para empezar a aprender de tus propias caídas.
Abre un canal de cuasi-incidentes sin culpables. El sistema de notificación de la aviación funciona porque notificar es seguro. Haz que sea seguro que tus ingenieros avisen de que el modelo hace cosas raras antes de que se conviertan en un postmortem.
Muestrea tu propio tráfico. Pon observabilidad en las entradas y salidas del modelo como vigilarías cualquier servicio en producción: deriva, respuestas anómalas, los usos para los que no lo diseñaste. Es la idea del Sentinel a escala de empresa, y es como encuentras el uso de alto riesgo antes de que lo haga un regulador o un periodista.
Gradúa tu propio escrutinio por irreversibilidad, no por organigrama. Concentra la revisión humana donde una respuesta equivocada no se puede deshacer; deja que el trabajo reversible avance rápido detrás de la vigilancia. Es toda la tesis del informe, aplicada un piso más abajo —y es, simplemente, priorizar bien.

Regula la IA como un sistema que funciona, no como un producto que se vende

El equilibrio justo nunca fue «más regulación» ni «menos». Es regulación apuntada al momento donde vive de verdad el riesgo. La Ley de IA gasta su rigor el día del despliegue —el único día en que menos sabemos cómo se comportará el sistema— y se lo cobra a todos por igual, lo que golpea más fuerte a los más pequeños. La corrección de Mariniello es mover ese rigor a donde los ingenieros ya lo guardamos: alrededor del sistema en marcha, escalado al alcance, proporcional a lo que no se puede deshacer, y pagado sobre todo por quien es lo bastante grande para soportarlo. Eso no es desregular. Es la madurez operativa a la que a los demás nos empujaron hace años —la noche en que aprendimos que no puedes demostrar que un sistema es seguro; solo puedes vigilarlo de cerca y estar listo para actuar.

El informe defiende que la UE no debería esperar hasta 2031 para enmendar la Ley. Yo iría un paso más allá: no esperes a Bruselas para nada. La observabilidad y la disciplina de incidentes que harían funcionar la regulación ex post son la misma disciplina que hace que tu producto sobreviva al contacto con usuarios reales. Si todavía estás mirando dónde cae la Ley de IA sobre tu propio stack, empieza por cómo Bruselas reclasificó una herramienta de contratación corriente como alto riesgo —y luego ve a montar la vigilancia, porque tarde o temprano el regulador te preguntará si la tenías.

La UE quiere certificar la IA antes de lanzarla. La IA no falla antes, falla después.

No puedes certificar un sistema cuyo comportamiento se descubre después de lanzarlo

De esta película ya nos salimos, se llama cascada

La factura por adelantado regala el mercado a los de siempre

«Lanzar y vigilar» también es una manera excelente de dejar que el daño ocurra primero

Qué montaría en mi stack de IA tire Bruselas hacia donde tire

Regula la IA como un sistema que funciona, no como un producto que se vende

Artículos Relacionados

La geopolítica del cómputo: estrategia de CTO cuando la regulación de la IA se fragmenta

La orden ejecutiva de Biden sobre IA: qué deben anticipar las startups europeas

Un modelo que corre en tu propio hardware no lo apaga ningún gobierno

¿Listo para construir tu equipo de ingeniería?