D’ici trois ans l’ensemble des décisions de justice seront en open data
La Cour de cassation et le Conseil d’Etat ont ouvert fin septembre 2021 leur portail d’accès aux décisions de justice. Les décisions des cours administratives d’appel et des tribunaux administratifs suivront au premier semestre 2022. Retour sur un dossier à épisodes, où l’ouverture de données nominatives n’a pu se faire sans des avancées en matière d’intelligence artificielle.
Le 30 septembre 2021 est paru un décret autorisant les traitements de données personnelles des bases "Décisions de la justice administrative" et "Judilibre". Leur vocation ? Donner accès à des décisions nominatives dans le respect des règles du RGPD. Très attendu, ce texte réglementaire marque une étape décisive dans une longue histoire mêlant adaptation de la réglementation et avancées technologiques pour automatiser l’anonymisation de plusieurs centaines de milliers de décisions.
Des obligations de 2016 précisées en 2019
L’ouverture des données des décisions de justice était inscrite dans la loi République numérique d’octobre 2016. Celle-ci prévoyait "une mise à disposition du public, à titre gratuit et dans le respect de la vie privée des personnes concernées, des décisions rendues par les juridictions administratives et judiciaires". Une formulation jugée floue par les parlementaires soucieux de protéger l’entourage des victimes et les professionnels du droit. La loi du 23 mars 2019 prévoit ainsi de pseudonymiser "les noms et prénoms des personnes physiques lorsqu’elles sont parties ou tiers" ou "lorsque la divulgation est de nature à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage". Elle a aussi écarté la publication de l'identité des magistrats et des membres du greffe et de tout élément susceptible de permettre la réidentification d’une personne (comme une plaque d’immatriculation). En outre, toute "personne intéressée" peut demander à la juridiction concernée une demande d'occultation ou la levée de l'anonymat des éléments d'identification.
Quatre ans pour ouvrir toutes les données
Les décrets d’application de ces textes se faisaient cependant attendre et il a fallu que l’association "ouvre boite" saisisse le Conseil d’Etat pour établir un calendrier. Le 21 janvier 2021, la haute juridiction a donné trois mois au ministère de la Justice pour que les décisions de justice soient effectivement ouvertes. La publication des feuilles de route open data des ministères (notre article) et le décret du 30 septembre répondent à cette injonction. Le ministère de la Justice a ainsi fixé un échéancier sur quatre ans. Les données des cours administratives d’appel seront publiées en mars 2022 et celles des tribunaux administratifs en juin 2022. En 2025, ce seront l’ensemble des décisions des juridictions qui seront accessibles.
Une intelligence artificielle pour trier les données nominatives
S’il a fallu plus de cinq ans pour que les données soient ouvertes, c’est que le défi technologique était de taille. Il s’agissait d’automatiser la pseudonymisation des décisions pour qu’elles restent intelligibles sans pour autant caviarder les noms de société ou d’organisation impliquées. Les hautes juridictions ont sollicité l’aide d’Etalab pour définir une méthode et concevoir une procédure automatisée respectueuse du RGPD. Ce travail a abouti à un guide d’anonymisation des données et à un logiciel de pseudonymisation publié en open source par la direction interministérielle du numérique en juin 2020 (notre article du 9 juin 2021). Cet algorithme est potentiellement exploitable par les collectivités territoriales pour publier des rapports, études ou délibérations intégrant des données nominatives.
Démocratisation de l’accès au droit
Cette ouverture de bases de données nominatives va bouleverser le métier de juristes dont une partie du temps est consacrée à la recherche de jurisprudence. Jusqu’alors, la publication des décisions impliquant des personnes physiques étaient laissées au bon vouloir des juridictions ou payantes, les grands éditeurs juridiques se chargeant de sélectionner et récupérer les décisions auprès des greffes. Désormais, ces décisions seront directement accessibles sur le site des institutions ou via un flux open data. Des données qui vont bénéficier aux éditeurs traditionnels mais aussi aux nombreuses jeunes pousses de la "Legal tech" dont la promesse est de faciliter et de démocratiser l’accès au droit.
Un nouveau site open data pour le Conseil d’Etat
Les décisions de justice du Conseil d’État, suivies par celles des cours administratives d’appel et des tribunaux administratifs au premier semestre 2022, vont être accessibles sur le portail existant Ariane Web. Celui-ci compte une sélection de 270.000 décisions publiées en raison de leur intérêt jurisprudentiel. Ce portail est complété par un nouveau site opendata.conseil-etat.fr doté de flux XML pour que la totalité des décisions (potentiellement 300.000 par an !) soient facilement réutilisables. Proposées sous licence ouverte 2.0, les décisions seront versées deux fois par mois sur la plateforme et classées par ordre chronologique. Plusieurs décisions, jamais publiées ont d’ores et déjà été versées fin septembre, un moteur de recherche étant attendu dans les prochaines semaines.