Archives

Données publiques - Open data : accélérer tout en protégeant les données personnelles

Dans un rapport publié le 16 avril, les sénateurs Gaëtan Gorce et François Pillet se penchent sur la protection des données personnelles dans l'open data. La France s'est fortement engagée ces dernières années sur la voie de l'ouverture et du partage des données publiques. Or malgré l'arsenal législatif et réglementaire très protecteur dont dispose notre pays, les deux rapporteurs mettent en garde contre de nouvelles menaces susceptibles de porter atteinte à la vie privée. Les énormes capacités de traitement informatiques désormais disponibles notamment avec ce qu'on appelle le "big data" ont mis en évidence les failles de la protection des données. En effet, même les données "anonymisées" peuvent être aujourd'hui "réidentifiées". En créant la mission d'information qui a travaillé sur ce rapport, il s'agissait donc pour la commission des lois du Sénat d'étudier en détail la nécessité de réajuster les dispositifs existants en les adaptant aux nouveaux environnements technologiques.

Trois verrous de sécurité dans l'arsenal législatif et réglementaire

Le cadre juridique français assure une protection des données personnelles. Tout d'abord, ces données ne peuvent être mises en ligne par l'administration ou être réutilisées par un tiers, sauf si l'usager donne son consentement à cette diffusion, s'il existe une obligation légale de publication (bans de mariage par exemple) ou lorsque les données publiées ont été préalablement anonymisées. Ensuite, toute réutilisation de données personnelles est soumise aux exigences de la loi Informatique et libertés. Enfin, le-non respect de ces règles peut entraîner des sanctions voire une condamnation pénale.
Selon les auteurs, ces barrières sont devenues insuffisantes. Le fait notamment de rendre les données anonymes ne suffit plus, affirment-ils : "La capacité de l'informatique moderne à croiser les informations fait de plus en plus porter le risque d'une réidentification. Un risque aggravé par la profusion de jeux de données mis en ligne par l'administration ou par les personnes privées elles-mêmes."

Retrouver un contribuable à partir de données anonymes...

Quelques exemples confirment bien la réalité de cette menace. Tout récemment, en 2013, l'identité et l'imposition de certains contribuables ont pu être retrouvées à partir d'une base dans laquelle les données nominatives avaient pourtant été neutralisées. Le procédé consistait à agréger toutes les impositions des contribuables habitant la même zone géographique par exemple, sur un carré de 200 mètres de côté dans une zone très peu peuplée. Il devenait alors facile de retrouver par croisement l'identité des personnes. Même constat dans le domaine de la santé : des données anodines en apparence suffisent pour identifier les personnes. Le rapport de Pierre-Louis Bras et André Loth sur la gouvernance et l'utilisation des données de santé (2013) rappelle que 89% des patients ayant connu un séjour à l'hôpital en 2008 sont ainsi identifiables (1).

Investir dans l'élaboration d'une doctrine de protection

Toutefois, les auteurs prennent bien garde de s'attaquer à l'open data dont il reconnaissent à la fois l'utilité démocratique et l'intérêt économique. Ils visent plutôt les administrations et la manière dont celles-ci gèrent leur politique d'ouverture. Aussi, ils invitent les acteurs publics à investir dans l'élaboration d'une doctrine de protection plus puissante et plus agile : par exemple en concevant dès le départ des bases de données facilitant l'anonymisation de l'identité, ou encore en réalisant, pour chaque base de données à publier, une étude d'impact sur le risque de "réidentification". L'Etat pourrait jouer un rôle majeur dans la perspective d'un renforcement de la sécurité en assistant les administrations publiques nationales comme locales sur les plans technique, juridique et organisationnel, en particulier dans le domaine de l'évaluation du risque de "réidentification" et dans la mise en oeuvre des procédés d'anonymisation. Les sénateurs formulent une vingtaine de propositions pour assurer la confiance à travers une meilleure protection des citoyens, non pour freiner le mouvement mais au contraire lui donner une impulsion supplémentaire afin de "porter plus haut l'exigence de transparence de l'action publique".

Philippe Parmantier / EVS

Les principales recommandations formulées par la mission d'information
1 – Accélérer le déploiement d'un open data respectueux des données personnelles sur le principe d'une obligation des administrations à publier progressivement toutes les bases de données qu'elles détiennent en les anonymisant lorsque c'est nécessaire.
2- Mettre en oeuvre une doctrine de protection fondée sur l'anonymisation et sur les études d'opportunité relatives à l'ouverture ou non de bases de données.
3- Adapter la diffusion en fonction du risque, par des systèmes de filtrage plus ou moins importants pouvant aller jusqu'à la perception d'une redevance.
4 – Assurer une veille sur la diffusion et les réutilisations des données publiques
5 – Renforcer la protection offerte par la licence de réutilisation en introduisant par exemple une clause de suspension légitime du droit de réutilisation.
6 – Mettre en place auprès de la mission Etalab une structure dédiée à la protection des données à caractère personnel et chargée d'assister les administrations.
7 – Garantir le financement par l'Etat des mesures d'anonymisation

(1) A condition de connaître l'hôpital d'accueil, le code postal du domicile, le mois et l'année de naissance, le sexe, le mois de sortie et la durée du séjour. Le chiffre de 89% passe à 100% pour les patients hospitalisés deux fois la même année.