Construire un Moteur d'IA Juridique Conforme : Routage Multi-Modele, RAG Juridique et le Reglement Europeen sur l'IA en Pratique
La plupart des produits d'IA sont construits en choisissant un modele, en ecrivant quelques prompts et en lançant. Cela fonctionne pour un chatbot. Cela ne fonctionne pas quand le resultat a un poids juridique, quand les donnees sont reglementees et quand une mauvaise reponse n'est pas seulement inutile — elle est potentiellement nuisible.
Quand nous avons construit le moteur d'IA derriere Bonus Iuri — une plateforme d'analyse de contrats qui examine des documents juridiques espagnols par rapport a la legislation reelle — chaque decision architecturale devait equilibrer trois exigences concurrentes : qualite de raisonnement, conformite reglementaire et durabilite des couts a grande echelle.
Cet article parcourt la reflexion derriere les decisions cles. Ce n'est pas un modele a copier — mais les principes qui nous ont guides dans un domaine ou se tromper a des consequences reelles.
Le Probleme Central : une IA Juridique qui N'Hallucine Pas
Le defi fondamental de l'IA juridique n'est pas de generer du texte qui sonne juridique. N'importe quel grand modele de langage peut produire une analyse juridique au ton convaincant. Le defi est de produire une analyse qui soit correcte — qui cite de vrais articles de vraies lois, qui identifie des risques reels bases sur une doctrine juridique etablie et qui distingue clairement entre ce que dit le contrat et ce qu'exige la loi.
Les references juridiques hallucinees ne sont pas un desagrement mineur. Un utilisateur qui se fie a une citation fabriquee de l'article 47 d'une loi qui n'a que 35 articles a ete activement lese par le produit. Ce n'est pas un cas limite a attenuer — c'est le probleme central a resoudre.
Notre approche reposait sur trois piliers architecturaux : la generation augmentee par recuperation conçue specifiquement pour le texte juridique, une politique stricte de verification des citations et un routage intelligent des modeles qui adapte la profondeur de raisonnement aux exigences de chaque tache.
Pilier 1 : RAG Base sur la Legislation
Les implementations standard de RAG decoupent les documents en blocs de texte de taille fixe — 512 tokens, 1 000 caracteres, quelle que soit la valeur par defaut — et recuperent les blocs les plus similaires a la requete. Cela fonctionne pour les bases de connaissances generales. Cela echoue pour la legislation.
Les documents juridiques ont une structure interne rigide : articles, sections, sous-sections, dispositions transitoires, considerants. Un bloc de taille fixe qui coupe un article sur les depots de location en deux fragments perd la coherence semantique qui donne son sens a l'article. Pire encore, il peut produire des recuperations qui combinent la fin d'un article avec le debut d'un autre, creant une reference chimerique qui semble valide mais ne l'est pas.
Le principe : decouper aux limites juridiques, pas a des comptages arbitraires de tokens.
Nous avons construit un pipeline de decoupage qui reconnait les sections et analyse la structure legislative avant de diviser. Le systeme detecte les limites d'articles, de sections, de chapitres et de dispositions. Chaque fragment correspond a une unite juridique complete — typiquement un article avec ses sous-sections, ou une section coherente d'un chapitre.
Le systeme couvre sept legislations espagnoles consolidees issues du BOE (Boletin Oficial del Estado) : le Codigo Civil, l'Estatuto de los Trabajadores, la Ley de Arrendamientos Urbanos, le droit des societes, le droit commercial, le droit de l'insolvabilite et la procedure administrative. Chacune est decoupee a ses limites structurelles, vectorisee et dedupliquee pour eviter l'accumulation d'entrees obsoletes.
Pourquoi la fraicheur compte : La legislation espagnole n'est pas statique. Les amendements et corrections apparaissent regulierement. Un systeme qui cite une version obsolete d'un article — modifiee il y a des mois — produit une analyse techniquement incorrecte. Maintenir l'index legislatif a jour est un cout operationnel que la plupart des prototypes ignorent. En production, c'est la difference entre un outil fiable et un risque.
Pilier 2 : Verification des Citations — "Pas de Source, Pas d'Affirmation"
Meme avec un RAG base sur la legislation, un LLM peut encore generer une analyse juridique plausible qui ne correspond a aucune source recuperee. Le modele pourrait interpoler entre deux articles reels, ou rappeler des schemas issus des donnees d'entrainement qui ne s'appliquent pas au droit espagnol.
Nous avons impose une regle stricte : chaque affirmation juridique dans le resultat doit etre traçable a un passage recupere specifique. Si le systeme ne peut pas ancrer une affirmation dans un texte legislatif reel, l'affirmation n'est pas faite.
Le pipeline d'analyse valide les citations au moment de la generation. Chaque affirmation juridique est verifiee par rapport au contexte recupere : le passage cite existe-t-il reellement ? Le document source correspond-il ? La pertinence est-elle suffisamment forte pour etayer l'affirmation ? Les affirmations qui echouent a la validation sont signalees plutot qu'incluses silencieusement.
Le resultat est une chaine de transparence : l'utilisateur peut tracer toute affirmation juridique jusqu'a un article specifique d'une loi specifique. Cette traçabilite est ce qui separe l'IA juridique utile de l'IA juridique dangereuse — et c'est ce qui donne a Bonus Iuri la credibilite pour servir des professionnels du droit, pas seulement des consommateurs curieux.
Pilier 3 : Routage Intelligent des Modeles
Toutes les taches d'une analyse juridique ne necessitent pas la meme profondeur de raisonnement. Router tout vers le modele le plus puissant (et le plus cher) est du gaspillage. Router tout vers le modele le moins cher produit une qualite inacceptable sur les taches de raisonnement complexe.
Nous avons construit une couche de routage qui selectionne le modele approprie par type de tache, en equilibrant qualite de raisonnement, latence et cout :
- Detection rapide des risques — le score initial en feux tricolores qui indique a l'utilisateur si son contrat presente des problemes meritant investigation — utilise un modele rapide et leger. Reponse en moins d'une seconde, cout marginal quasi nul.
- Analyse juridique complete — la liste de verification detaillee avec raisonnement, citations et matrice des risques — est routee vers un modele avec des capacites de raisonnement multi-etapes plus solides.
- Scenarios complexes multi-lois — des contrats couvrant plusieurs domaines juridiques — utilisent des modeles optimises pour le referencement croise en chaine de pensee.
Pourquoi c'est important economiquement : Une plateforme d'IA juridique freemium vit ou meurt par son economie unitaire. Si chaque analyse gratuite est couteuse, la mise a l'echelle du niveau gratuit devient insoutenable. Le routage intelligent maintient la viabilite du niveau gratuit tout en reservant un raisonnement plus approfondi aux utilisateurs payants. Ce n'est pas qu'une optimisation des couts — c'est une decision de conception produit qui façonne l'experience utilisateur a chaque niveau.
La Conformite comme Architecture, Pas comme Liste de Verification
Dans les produits d'IA reglementes, la conformite est souvent traitee comme une etape finale de revision : construire le produit, puis cocher les cases. Cette approche echoue parce qu'elle produit des architectures couteuses a modifier retroactivement et une documentation de conformite qui ne reflete pas le comportement reel du systeme.
Pour Bonus Iuri, les exigences de conformite ont façonne l'architecture des le premier jour :
La minimisation des donnees du RGPD a guide le modele de stockage. Les documents des utilisateurs sont traites avec une persistance minimale. Quand le stockage est necessaire, les donnees de chaque utilisateur sont structurellement isolees — pas seulement par des controles d'acces, mais par l'architecture de stockage elle-meme. Aucun acces croise aux donnees entre utilisateurs n'est possible au niveau de l'infrastructure.
Le droit a l'effacement a guide le cycle de vie des donnees. La suppression de compte declenche une cascade complete : documents, embeddings derives et enregistrements d'analyse sont definitivement supprimes. Pas de suppression logique avec nettoyage ulterieur — immediate et irreversible.
La transparence du Reglement Europeen sur l'IA a guide le format de sortie. Chaque analyse inclut une divulgation claire des systemes d'IA impliques, de leurs limitations et des garanties concernant le traitement des donnees. Ce n'est pas un lien en pied de page vers une politique generale — c'est une divulgation contextuelle attachee au resultat que l'utilisateur est en train de lire.
L'ethique du CCBE a guide le positionnement du produit. La plateforme est explicitement un outil d'analyse juridique, pas un substitut au conseil juridique. Les avertissements sont integres dans le parcours utilisateur, pas enfouis dans les conditions d'utilisation.
L'investissement : environ une semaine sur un projet de six semaines. C'est significatif dans un calendrier serre. Mais adapter retroactivement la conformite a une architecture non conforme aurait coute deux a trois fois plus et produit un resultat plus faible.
Des Pipelines de Domaine Plutot que des Prompts Generiques
L'approche la plus simple pour l'analyse de contrats est un prompt unique : "Analyse ce contrat et identifie les risques." Cette approche produit une analyse generique et superficielle — l'equivalent IA de la premiere lecture d'un etudiant en droit.
Nous avons construit des pipelines d'analyse specialises pour chaque type de contrat. Chacun comprend :
- Mapping legislatif specifique par type. Une analyse de contrat de travail fait reference au droit du travail. Une analyse de bail fait reference a la loi sur les baux. Le systeme recupere depuis le cadre juridique pertinent, pas depuis l'ensemble du corpus.
- Criteres d'evaluation specifiques au domaine. Chaque type de contrat a des points d'evaluation structures derives de ce qu'un avocat espagnol en exercice verifierait — des exigences juridiques specifiques avec des references statutaires specifiques, pas des instructions generiques du type "chercher les risques".
- Notation des risques calibree. Ce qui constitue un "risque eleve" differe selon le type de contrat. L'absence d'une clause d'indemnisation dans un contrat de travail est une violation legale. L'absence d'un SLA dans un contrat de services est une preoccupation de negociation. La notation reflete ces distinctions.
La difference de qualite est l'ecart entre "ce contrat a quelques problemes potentiels" et "la clause 7.3 fixe une periode d'essai de 9 mois, ce qui depasse le maximum legal pour les travailleurs qualifies selon l'article correspondant de l'Estatuto de los Trabajadores."
Vous pouvez voir ce niveau de specificite en action sur bonusiuri.pro.
Ce que Cela Signifie pour les Autres Domaines Reglementes
Les principes derriere le moteur d'IA de Bonus Iuri ne sont pas specifiques a la legaltech. Ils s'appliquent a tout produit d'IA dans un domaine reglemente :
- Recuperation structurellement consciente — ne decoupez pas les documents du domaine de maniere arbitraire. Comprenez leur structure interne et preservez-la.
- Verification des citations — si l'IA ne peut pas ancrer une affirmation, elle ne devrait pas la faire. La traçabilite n'est pas optionnelle dans les domaines a enjeux eleves.
- Routage intelligent — adaptez la capacite du modele aux exigences de la tache. Toutes les requetes n'ont pas besoin de votre modele le plus couteux.
- Architecture conformite-d'abord — integrez les exigences reglementaires dans le modele de donnees et l'infrastructure, pas dans une liste de verification.
- Specialisation de domaine — les prompts generiques produisent des resultats generiques. Investissez dans des pipelines specifiques au domaine.
Ce ne sont pas des recommandations theoriques. Ce sont les principes que nous avons appliques pour livrer une plateforme d'IA juridique en production en six semaines — et ils sont directement transferables a la sante, la finance, l'assurance et d'autres domaines ou les resultats de l'IA ont des consequences reelles.
Vous construisez un produit d'IA dans un domaine reglemente ? Parlez a un CTO pour decouvrir comment l'architecture conformite-d'abord peut comprimer votre calendrier sans couper les coins.


