Fondamentalement, les technologies du web de données ("linked data") apportent…
Article dans la revue I2D – ELI : une « mise en lien » des textes juridiques européens
A l’occasion du dossier « Web de données et création de valeurs : le champ des possibles » dans la revue de l’ADBS I2D de juin 2016, je cosigne avec Jean Delahousse cet article sur le projet ELI, dont il avait déjà été question ici.
ELI : une « mise en lien » des textes juridiques européens
La législation est, pour les pays d’Europe et pour l’Union européenne, un élément structurant de la vie des citoyens, de l’activité économique et du débat politique. La législation nationale et régionale s’impose aux citoyens qui peuvent également invoquer le droit européen auprès des juridictions nationales ou lors d’un appel auprès de la Cour de justice européenne. Les entreprises qui opèrent en Europe doivent appréhender la réglementation d’une trentaine de pays, mais également les évolutions des législations techniques, commerciales et financières que préparent la Commission et le Parlement européens et qui seront transposées en droit national.
Face à l’importance du droit mais aussi à la complexité d’accès à des corpus juridiques linguistiquement hétérogènes et géographiquement dispersés, les Journaux officiels (JO) européens ont voulu innover en imaginant un système original d’identification, de signalement et de mise en relation des corpus juridiques à travers l’Europe : le standard ELI (European Legislation Identifier)1. Cette initiative a reçu le soutien officiel de l’Union européenne en 20122. Les premiers résultats sont exploitables depuis 2015 grâce aux précurseurs qu’ont été les JO anglais, français, italiens, luxembourgeois et européens. D’autres états membres le déploient actuellement, sur la base du volontariat.
ELI utilise les technologies du web de données
ELI permet d’identifier, décrire et relier les textes de lois sur le web de données dont il utilise les technologies pour arriver à son objectif :
- les identifiants des textes de loi sont des URIs ;
- ceux-ci sont décrits suivant un modèle de données formalisé, comme une ontologie ;
- ces descriptions sont ajoutées aux portails web de diffusion des lois à l’aide de marquage sémantique RDFa ;
- les liens se font à l’échelle du Web, d’un URI vers un autre.
Dans une logique d’accès simplifié à la loi, ELI impose que les identifiants soient signifiants, « lisibles » par l’humain et associés à une logique de navigation dans le corpus législatif. Par exemple, la directive européenne 2003/98/CE sur l’ouverture des données publiques3 (qui a ouvert la voie à l’Open data) est identifiée par le ELI : http://data.europa.eu/eli/dir/2003/98/oj ; sa transposition dans la loi française (décret n° 2005-1755 du 30 décembre 2005) peut être identifiée par https://www.legifrance.gouv.fr/eli/decret/2005/12/30/2005-1755/jo/texte, et une métadonnée indiquera que le décret français « eli:transposes » la directive européenne.
Modèle FRBR et graphe de données législatif
Le modèle FRBR prescrit le découpage des notices documentaires en niveaux conceptuels : Oeuvre, Expression, Manifestation, Item4, auxquels FRBRoo5 ajoute – entre autres – le niveau d’« Oeuvre complexe »6. Ces modèles proposent également de nombreuses propriétés pour décrire chacun des niveaux, créant des modèles précis mais complexes.
ELI se veut à la fois générique (applicable aussi bien pour la common law que pour le droit codifié), simple à implémenter, mais rigoureux dans la description des lois ; il a donc défini un modèle compatible avec l’idée-clé du découpage des notices en 4 niveaux conceptuels, mais dépouillé du reste de la complexité de FRBRoo. Une quarantaine de champs sont spécifiés, en particulier les liens entre lois : « modifie », « cite », « baséSur », etc.
Les niveaux FRBR – plus l’« Oeuvre complexe » FRBRoo – sont donc appliqués à la description des lois :
- Oeuvre complexe : texte juridique identifié par un certain nombre de composants invariants dans le temps (Directive 2003/98/CE) ;
- Oeuvre : version spécifique du texte au cours du temps ; typiquement sa version d’origine (publiée au JO) ou l’une de ses versions consolidées ;
- Expression : variante linguistique d’une version particulière, dans des systèmes législatifs multilingues (comme la loi européenne) ;
- Manifestation : format de fichier spécifique d’une variante linguistique d’une version particulière ; typiquement, le PDF authentifié pour la version opposable du JO ou la version HTML.
En accord avec la logique des données (et modèles) liées, chaque État membre peut spécialiser les descriptions ELI avec ses propres champs, conservant ainsi une sémantique précise tout en restant compatible avec le cadre général.
Un cadre flexible pour une adoption progressive
L’approche d’ELI n’est pas contraignante : chaque État peut spécifier sa propre structure d’URI à partir des composantes définies par ELI, choisir de publier seulement certaines métadonnées ou implémenter ELI uniquement sur une partie de son corpus.
Pour les JO qui ont une pratique de catalogage des textes légaux, ELI dans sa forme la plus simple a peu d’impact sur les chaînes de production documentaires ; il peut être implémenté en ajoutant uniquement des métadonnées en RDFa dans les pages web finales, sans impact ni sur le reste du flux ni sur l’expérience utilisateur, la principale tâche du JO étant de publier ses métadonnées à l’aide des champs de l’ontologie. ELI constitue donc pour les JO une première marche vers le web de données ; une fois la dynamique enclenchée, les flux documentaires pourront être enrichis avec plus de métadonnées ou des descriptions plus précises.
Le graphe des données ELI, en cours de constitution, est un objet original dans le paysage du web des données ; par sa publication décentralisée, son adaptabilité et la légèreté des moyens mis en œuvre, il se différencie d’un projet tel qu’Europeana7 qui vise à constituer un catalogue centralisé d’œuvres d’art. En effet, dans ELI, chaque acteur garde la charge de publier son propre graphe de notices documentaires en s’appuyant sur sa propre infrastructure. Il se différencie également du projet multilingue Wikipedia/Dbpedia8 car les données sont publiées dès l’origine pour le web des données à partir d’une activité de catalogage professionnelle. Il s’en différencie encore par la variété des acteurs dont les statuts sont très divers : administrations nationales, régionales ou européennes mais aussi éditeurs privés assurant une mission de service public.
ELI concilie adaptabilité et interopérabilité en s’appuyant sur un mix de référentiels partagés publiés par l’Union européenne (langues, lieux, statuts des documents, formats de fichiers) comme sur des référentiels propres à la législation nationale (acteurs juridiques, types de texte).
Cette coordination originale d’acteurs divers qui publient avec leurs moyens propres des graphes complémentaires dans le web des données exige une implémentation simple et économique, mobilisant un minimum de compétences spécialisées. Simple, car la mise en œuvre est réalisée par les JO qui n’ont pas au départ de compétences dans les technologies du web sémantique. Économique, car le coût de mise en œuvre ne devrait pas dépasser quelques dizaines de milliers d’euros pour les JO aux budgets les plus réduits. Les solutions pour répondre à ce challenge sont le partage de retours d’expérience entre JO, des formations pour chaque pays et un standard stable pour éviter des coûts de maintenance élevés.
Premiers exemples de réutilisation
L’objectif d’ELI est de permettre de construire au meilleur coût des applications qui s’appuient sur le graphe de données des législations européennes. Grâce au travail de vulgarisation réalisé par le mouvement associatif, comme Open Law en France, des premiers projets de réutilisation apparaissent. On peut citer, par exemple, le tableau de bord d’Open Law9 qui, avec environ 12 jours de travail, a permis de récupérer et exploiter les données ELI françaises, italiennes et européennes, ou le travail en cours par un éditeur de logiciels, KBCrawl, pour exploiter les données ELI dans une application de veille juridique sectorielle. Leur point commun est d’avoir abouti à la création de services à haute valeur ajoutée pour des investissements de quelques jours à quelques dizaines de jours, avec la possibilité d’étendre le service sur les données d’autres pays utilisant le standard ELI.
En combinant ontologie générique, adressage à plusieurs niveaux, liens entre lois nationales et loi européenne, le tout dans un contexte multilingue, ELI crée donc un véritable graphe de données législatives à l’échelle européenne. Le web coopératif et décentralisé entre ici en résonance avec le projet européen, lui aussi coopératif et décentralisé.
1 ELI register : http://eur-lex.europa.eu/eli-register/about.html, voir également http://eli.fr
2 Conclusions du Conseil préconisant l’introduction d’un identifiant européen de la législation (ELI) : http://eur-lex.europa.eu/legal-content/FR/TXT/?uri=CELEX:52012XG1026%2801%29
3 Directive « PSI » : http://eur-lex.europa.eu/legal-content/FR/NOT/?uri=CELEX:32003L0098
4 FRBR : www.bnf.fr/fr/professionnels/modelisation_ontologies/a.modele_FRBR.html
5 FRBR object-oriented
6 FRBRoo Complex Work : www.ifla.org/files/assets/cataloguing/frbr/frbroo_v2.2.pdf
7 Europeana : www.europeana.eu/portal
8 DBPedia francophone : http://fr.dbpedia.org
9 Tableau de bord d’OpenLaw : http://ld.openlaw.fr