De l'open data au small data, le pilotage par la donnée à petits pas
Quatre ans après la loi Lemaire, l’ouverture des données publiques ne fait plus débat. L’enjeu des administrations publiques est désormais de développer les usages et les réutilisations, en commençant par l’interne. Une journée d’échanges organisée le 5 novembre 2020 par l’éditeur OpenDataSoft a montré comment les applications et datavisualisation pouvaient aider agents et citoyens à s’approprier les données. En commençant par celles de la crise sanitaire.
Axelle Lemaire était l'invitée du colloque annuel d'OpenDataSoft consacré aux bonnes pratiques en matière de partage de données. Pour l'auteure de la loi République numérique de 2016, devenue consultante après avoir été secrétaire d'Etat au numérique, le bilan de la mise en œuvre de la loi fondatrice de l'open data par défaut est clairement positif. "Il y a cinq ans il fallait tout expliquer, désormais si on parle moins de l’open data c’est que le potentiel de l’ouverture des données n’est plus à démontrer", a-t-elle expliqué au cours d’une intervention préenregistrée. La création de valeur et l’innovation seraient ainsi clairement au rendez-vous, les marges de progression portant davantage sur "la transparence" et le "partage des connaissances scientifiques". Celle que l’on a surnommée encore "lady data" souhaite désormais faire "sortir l’open data du monde des experts" et invite à utiliser les enjeux environnementaux (RSE, empreinte carbone) pour développer le partage de données, notamment dans la sphère privée. Elle invite aussi à préférer le "small data" au "big data" en privilégiant des données moins nombreuses mais de qualité, favorisant "une stratégie des petits pas".
La crise du Covid comme accélérateur
Il s’agit aussi de savoir profiter des occasions pour avancer dans le partage des données, comme l’illustre la pandémie. "La crise du Covid 19 a obligé des ministères et des structures qui ne se parlaient pas à concevoir un dispositif de remontée d’informations indispensables au suivi de la pandémie. Le problème n’était pas technique mais organisationnel", a-t-elle souligné. Comme l’explique ce post du blog d’Etalab, il a en effet fallu interconnecter des systèmes qui fonctionnaient jusqu'alors en silo (hôpitaux, ARS, SOS médecins, laboratoires...) où qui étaient très peu numérisés comme les Ephad. Avec au final des données épidémiologiques centralisées sur le site de Santé publique France et rediffusées via l’open data à des centaines de structures ou d'applications, à l'image de TousAntiCovid ou encore des tableaux de bord de la région Réunion. Pour l'Urssaf "la crise a permis de montrer les bénéfices de notre nouvelle plateforme open data avec la publication de toutes les données utiles à notre communication" a expliqué Carole Leclerc, directrice de l'innovation et du digital à l’ACOSS. Des données qui illustrent par exemple l’effet de la pandémie sur les entreprises via les taux d'impayés de cotisation ou encore les volumes d’aides aux indépendants.
La recherche du cas d’usage probant
La recherche des bonnes thématiques, de cas d’usage probants pour développer le partage de données et convaincre les services de s’y mettre se révèlent la clé. L’énergie et la mobilité en font partie. Pour les collectivités, le partage de données énergétiques peut en outre générer des économies. "Nous nous sommes rendu compte que la plupart des 4.000 factures que nous recevions contenaient des erreurs avec une surfacturation de 30.000 euros", a expliqué Emmanuel Dion, chef de projet énergies du patrimoine public à Nantes Métropole. La plateforme de données de suivi des consommations des bâtiments publics (à usage interne) aide également la collectivité à prioriser ses chantiers en se concentrant sur les bâtiments les plus énergivores ou présentant des consommations anormales, comme lorsque le bâtiment est inoccupé. En d’autres termes, pas question de lancer un ambitieux programme de "smart building" - et de déclencher un tsunami de data – avant que la collectivité dispose de cas d’usage concrets et probants. Une stratégie des petits pas également adoptée par le gestionnaire du réseau électrique de la Vienne, l’entreprise publique locale SRD. La publication des données de consommation, imposées par la loi TECV de 2015, bénéficie ainsi d’abord aux intercommunalités pour leur permettre d’élaborer leur plan énergie climat. SRD va cependant au-delà des obligations réglementaires. Ses données sur les réseaux de distribution, et leur distance par rapport aux parcelles susceptibles d’accueillir des installations photovoltaïques sont par exemple utilisées pour la réalisation des études de faisabilité.
Des datavisualisations pour s’approprier les données
L’acculturation à la donnée et leur appropriation par le plus grand nombre passe également par la mise à disposition d’applications concrètes ou de datavisualisations. Parfois elles sont faites à la demande des services comme en région Occitanie qui a produit sur demande une carte des tiers lieux ou un outil d’analyse des marchés de BTP. Dans le département de l’Hérault, l’un des services les plus populaires concerne le raccordement à la fibre. Les fichiers Informations préalables enrichies (IPE) – qui précisent si une adresse est raccordée ou raccordable – sont diffusés sous forme de carte zoomable. Avec à la clef des informations plus à jour que sur le site de l’Arcep car elles sont prises à la source auprès du gestionnaire de réseau publique départemental. A La Réunion, le nouveau portail a mis l’accent sur la transparence en proposant une carte géolocalisant l’ensemble des achats publics et fournisseurs de la collectivité. Pour ce territoire qui doit verdir son électricité d’ici 2030, EDF propose de son coté un graphique de la production énergétique par filière mis à jour en temps réel. "Une première que nous souhaitons étendre aux autres territoires ultramarins et à la Corse", a précisé Amalia Ouriachi, chef de projet smart grids chez EDF SEI. A Paris, la ville est également passée aux données en temps réel avec une datavisualisation donnant la courbe du trafic vélo dans la capitale notamment là ou des pistes cyclables provisoires ont été installées. "Un outil qui sera utilisé par les élus pour décider de la pérennité de ces installations", a expliqué le "chief data officer" de la ville Jean Philippe Clément. Pour l’Observatoire des finances et de la gestion publique locales (OFGL), qui pilote le portail data.ofgl.fr construit à partir des données de la DGFIP et de la DGCL, les datavisualisations sont autant d’outils utiles pour vulgariser un sujet un peu aride. Des dataviz donnent ainsi un coup de projecteur sur la répartition des dotations des communes, les finances des CCAS ou encore des Sdis. "Ces représentations nous sont très utiles pour débattre par exemple des effets de la crise du Covid sur les finances locales", souligne Nicolas Laroche, chargé de mission à l’OFGL.