← Volver a todos los artículos
Retos

Construir un Motor de IA Legal con Cumplimiento Normativo: Enrutamiento Multi-Modelo, RAG Legal y el Reglamento Europeo de IA en la Practica

Por Marc Molas·15 de enero de 2026·10 min de lectura

La mayoria de los productos de IA se construyen eligiendo un modelo, escribiendo algunos prompts y lanzando. Eso funciona para un chatbot. No funciona cuando la salida tiene peso legal, cuando los datos estan regulados y cuando una respuesta incorrecta no es solo inutil — es potencialmente danina.

Cuando construimos el motor de IA detras de Bonus Iuri — una plataforma de analisis de contratos que revisa documentos legales espanoles contra legislacion real — cada decision arquitectonica tuvo que equilibrar tres demandas en competencia: calidad de razonamiento, cumplimiento normativo y sostenibilidad de costes a escala.

Este articulo recorre el razonamiento detras de las decisiones clave. No es un modelo que puedas copiar — sino los principios que nos guiaron en un dominio donde equivocarse tiene consecuencias reales.

El Problema Central: IA Legal que No Alucina

El desafio fundamental en la IA legal no es generar texto que suene juridico. Cualquier modelo de lenguaje grande puede producir analisis legales que suenan convincentes. El desafio es producir analisis que sean correctos — que citen articulos reales de leyes reales, que identifiquen riesgos genuinos basados en doctrina juridica establecida y que distingan claramente entre lo que dice el contrato y lo que exige la ley.

Las referencias legales alucinadas no son una molestia menor. Un usuario que se basa en una cita fabricada del articulo 47 de una ley que solo tiene 35 articulos ha sido activamente perjudicado por el producto. Esto no es un caso extremo a mitigar — es el problema central a resolver.

Nuestro enfoque se sustento en tres pilares arquitectonicos: generacion aumentada por recuperacion disenada especificamente para texto legal, una politica estricta de verificacion de citas y enrutamiento inteligente de modelos que ajusta la profundidad de razonamiento a los requisitos de cada tarea.

Pilar 1: RAG Basado en Legislacion

Las implementaciones estandar de RAG dividen los documentos en bloques de texto de tamano fijo — 512 tokens, 1.000 caracteres, lo que sea el valor por defecto — y recuperan los bloques mas similares a la consulta. Esto funciona para bases de conocimiento generales. Falla para la legislacion.

Los documentos legales tienen una estructura interna rigida: articulos, secciones, subsecciones, disposiciones transitorias, considerandos. Un bloque de tamano fijo que divide un articulo sobre depositos de alquiler en dos fragmentos pierde la coherencia semantica que hace significativo al articulo. Peor aun, puede producir recuperaciones que combinan el final de un articulo con el inicio de otro, creando una referencia quimerica que parece valida pero no lo es.

El principio: dividir en los limites legales, no en conteos arbitrarios de tokens.

Construimos un pipeline de fragmentacion que reconoce secciones y analiza la estructura legislativa antes de dividir. El sistema detecta los limites de articulos, secciones, capitulos y disposiciones. Cada fragmento corresponde a una unidad legal completa — tipicamente un articulo con sus subsecciones, o una seccion coherente de un capitulo.

El sistema cubre siete legislaciones espanolas consolidadas obtenidas del BOE (Boletin Oficial del Estado): el Codigo Civil, el Estatuto de los Trabajadores, la Ley de Arrendamientos Urbanos, derecho mercantil, derecho comercial, concursal y procedimiento administrativo. Cada una se fragmenta en sus limites estructurales, se vectoriza y se deduplica para evitar que se acumulen entradas obsoletas.

Por que importa la frescura: La legislacion espanola no es estatica. Las enmiendas y correcciones aparecen regularmente. Un sistema que cita una version obsoleta de un articulo — una que fue modificada hace meses — produce analisis tecnicamente incorrectos. Mantener actualizado el indice legislativo es un coste operativo que la mayoria de los prototipos ignoran. En produccion, es la diferencia entre una herramienta fiable y un riesgo.

Pilar 2: Verificacion de Citas — "Sin Fuente, Sin Afirmacion"

Incluso con RAG basado en legislacion, un LLM puede generar analisis legales que suenan plausibles pero no corresponden a ninguna fuente recuperada. El modelo podria interpolar entre dos articulos reales, o recordar patrones de los datos de entrenamiento que no aplican al derecho espanol.

Impusimos una regla estricta: cada afirmacion legal en la salida debe ser rastreable a un pasaje recuperado especifico. Si el sistema no puede fundamentar una afirmacion en un texto legislativo real, la afirmacion no se hace.

El pipeline de analisis valida las citas en tiempo de generacion. Cada afirmacion legal se verifica contra el contexto recuperado: ¿existe realmente el pasaje citado? ¿Coincide el documento fuente? ¿Es la relevancia suficientemente fuerte para sustentar la afirmacion? Las afirmaciones que no superan la validacion se marcan en lugar de incluirse silenciosamente.

El resultado es una cadena de transparencia: el usuario puede rastrear cualquier afirmacion legal hasta un articulo especifico de una ley especifica. Esa trazabilidad es lo que separa la IA legal util de la IA legal peligrosa — y es lo que da a Bonus Iuri la credibilidad para servir a profesionales del derecho, no solo a consumidores curiosos.

Pilar 3: Enrutamiento Inteligente de Modelos

No todas las tareas en un analisis legal requieren la misma profundidad de razonamiento. Enrutar todo a traves del modelo mas potente (y caro) es un desperdicio. Enrutar todo a traves del modelo mas barato produce una calidad inaceptable en tareas de razonamiento complejo.

Construimos una capa de enrutamiento que selecciona el modelo apropiado por tipo de tarea, equilibrando calidad de razonamiento, latencia y coste:

  • Deteccion rapida de riesgos — la puntuacion inicial tipo semaforo que indica al usuario si su contrato tiene problemas que vale la pena investigar — utiliza un modelo rapido y ligero. Respuesta en menos de un segundo, coste marginal cercano a cero.
  • Analisis legal completo — la lista de verificacion detallada con razonamiento, citas y matriz de riesgos — se enruta a un modelo con capacidades mas fuertes de razonamiento multi-paso.
  • Escenarios complejos multi-ley — contratos que abarcan multiples dominios legales — utilizan modelos optimizados para referencias cruzadas con cadena de pensamiento.

Por que esto importa economicamente: Una plataforma de IA legal freemium vive o muere por su economia unitaria. Si cada analisis gratuito es caro, escalar el nivel gratuito se vuelve insostenible. El enrutamiento inteligente mantiene viable el nivel gratuito mientras reserva un razonamiento mas profundo para los usuarios de pago. No es solo optimizacion de costes — es una decision de diseno de producto que moldea la experiencia del usuario en cada nivel.

Cumplimiento como Arquitectura, No como Lista de Verificacion

En los productos de IA regulados, el cumplimiento normativo se trata a menudo como un paso final de revision: construye el producto y luego marca las casillas. Este enfoque falla porque produce arquitecturas costosas de modificar retroactivamente y documentacion de cumplimiento que no refleja el comportamiento real del sistema.

Para Bonus Iuri, los requisitos de cumplimiento dieron forma a la arquitectura desde el primer dia:

La minimizacion de datos del RGPD impulso el modelo de almacenamiento. Los documentos de los usuarios se procesan con persistencia minima. Cuando el almacenamiento es necesario, los datos de cada usuario estan estructuralmente aislados — no solo mediante controles de acceso, sino a traves de la propia arquitectura de almacenamiento. Ningun acceso cruzado de datos entre usuarios es posible a nivel de infraestructura.

El derecho de supresion impulso el ciclo de vida de los datos. La eliminacion de cuenta desencadena una cascada completa: documentos, embeddings derivados y registros de analisis se eliminan permanentemente. No es una eliminacion logica con limpieza eventual — es inmediata e irreversible.

La transparencia del Reglamento Europeo de IA impulso el formato de salida. Cada analisis incluye una divulgacion clara de los sistemas de IA involucrados, sus limitaciones y garantias sobre el manejo de datos. Esto no es un enlace al pie de pagina a una politica general — es una divulgacion en contexto adjunta a la salida que el usuario esta leyendo.

La etica del CCBE impulso el posicionamiento del producto. La plataforma es explicitamente una herramienta de analisis legal, no un sustituto del asesoramiento juridico. Los avisos estan integrados en el flujo del usuario, no enterrados en los terminos de servicio.

La inversion: aproximadamente una semana de un proyecto de seis semanas. Eso es significativo en un plazo ajustado. Pero adaptar retroactivamente el cumplimiento en una arquitectura no conforme habria costado dos o tres veces mas y habria producido un resultado mas debil.

Pipelines de Dominio en Lugar de Prompts Genericos

El enfoque mas simple para el analisis de contratos es un unico prompt: "Analiza este contrato e identifica riesgos." Ese enfoque produce analisis genericos y superficiales — el equivalente en IA de la primera lectura de un estudiante de derecho.

Construimos pipelines de analisis especializados para cada tipo de contrato. Cada uno incluye:

  • Mapeo de legislacion especifica por tipo. Un analisis de contrato laboral hace referencia al derecho laboral. Un analisis de alquiler hace referencia a la ley de arrendamientos. El sistema recupera del marco legal relevante, no de todo el corpus.
  • Criterios de evaluacion especificos del dominio. Cada tipo de contrato tiene puntos de evaluacion estructurados derivados de lo que un abogado espanol en ejercicio verificaria — requisitos legales especificos con referencias estatutarias especificas, no instrucciones genericas de "buscar riesgos".
  • Puntuacion de riesgo calibrada. Lo que constituye "alto riesgo" difiere por tipo de contrato. La ausencia de una clausula de indemnizacion en un contrato laboral es una violacion legal. La ausencia de un SLA en un contrato de servicios es una preocupacion de negociacion. La puntuacion refleja estas distinciones.

La diferencia de calidad es la brecha entre "este contrato tiene algunos problemas potenciales" y "la clausula 7.3 establece un periodo de prueba de 9 meses, lo que excede el maximo legal para trabajadores cualificados segun el articulo correspondiente del Estatuto de los Trabajadores."

Puedes ver este nivel de especificidad en accion en bonusiuri.pro.

Que Significa Esto para Otros Dominios Regulados

Los principios detras del motor de IA de Bonus Iuri no son especificos de la tecnologia legal. Se aplican a cualquier producto de IA en un dominio regulado:

  1. Recuperacion con conciencia estructural — no fragmentes documentos del dominio de forma arbitraria. Comprende su estructura interna y preservala.
  2. Verificacion de citas — si la IA no puede fundamentar una afirmacion, no deberia hacerla. La trazabilidad no es opcional en dominios de alto riesgo.
  3. Enrutamiento inteligente — ajusta la capacidad del modelo a los requisitos de la tarea. No todas las consultas necesitan tu modelo mas caro.
  4. Arquitectura con cumplimiento desde el inicio — incorpora los requisitos regulatorios en el modelo de datos y la infraestructura, no en una lista de verificacion.
  5. Especializacion de dominio — los prompts genericos producen resultados genericos. Invierte en pipelines especificos del dominio.

Estas no son recomendaciones teoricas. Son los principios que aplicamos para lanzar una plataforma de IA legal en produccion en seis semanas — y son directamente transferibles a salud, finanzas, seguros y otros dominios donde la salida de la IA tiene consecuencias reales.


¿Estas construyendo un producto de IA en un dominio regulado? Habla con un CTO sobre como la arquitectura con cumplimiento desde el inicio puede comprimir tu cronograma sin tomar atajos.

¿Listo para construir tu equipo de ingeniería?

Habla con un partner técnico y despliega ingenieros validados por CTOs en 72 horas.