Fiche de lecture

Instaurer des données, instaurer des publics : une enquête sociologique dans les coulisses de l’open data

Open data, le temps du bilan et du rebond ? Une fiche de lecture de l’essai de Samuel Goëta

2 décembre 2024

15 ans après, les promesses de l’open data en termes d’innovation et de renouveau démocratique ont-elles été tenues ? Une analyse critique du sociologue Samuel Goëta, spécialiste de l’open data par une fiche de lecture de son ouvrage « Les données de la démocratie : open data, pouvoirs et contre-pouvoirs ».

Étudiant à l’université du Michigan en 2008, le sociologue Samuel Goëta se retrouve plongé dans les débuts de l’open data aux Etats-Unis, un mouvement qui défend un accès libre et gratuit aux données produites par les institutions publiques. Barack Obama, tout juste élu, lance data.gov et enclenche alors une dynamique mondiale. De retour en France, Samuel Goëta commence en 2012 une thèse en sociologie sur l’émergence de l’open data en France, puis co-fonde en 2016 la coopérative Datactivist

Outil de contre-pouvoir citoyen pour les uns, d’innovation économique pour les autres, voire d’instrument d’ubérisation de l’Etat, l’open data, après une période d’enthousiasme, se retrouve soumis aux vents tourbillonnants des changements d’orientation politique et finit par tomber relativement dans l’ombre jusqu’à la survenue du Covid-19. La pandémie relance le sujet de la transparence de l’action publique dans un contexte de défiance généralisée et la nécessité d’ouvrir les données publiques pour stimuler l’innovation en cette période d’urgence sanitaire. Depuis deux ans, c’est le déploiement massif des outils d’intelligence artificielle qui mobilise l’écosystème de l’open data.

La première partie du livre revient sur l’histoire de l’open data, remontant ses racines à une ère pré-numérique, puis, dans la seconde partie, l’auteur pose un regard critique sur l’impact de l’open data et les raisons de ses défaillances. Il présente, enfin, dans la troisième partie, des pistes pour corriger les écueils actuels et relancer le développement de l’open data dans une perspective plus démocratique qu’économique, avec en toile de fond, l’accélération de la gouvernance par les données à travers l’intelligence artificielle et les enjeux de la crise climatique et environnementale. 

Cet essai, contribue, en outre, à éclairer la culture des tiers-lieux dans leur composante numérique et technologique (fablabs, makerspaces, hackathon, médiation numérique et data-literacy, etc.), en raison de leur proximité avec le mouvement de l’open data tant dans ses objectifs que dans ses combats : logiciels et licences libres, communs numérique, contre-pouvoir citoyens, gouvernance participative, refondation de la relation entre citoyens et gouvernants, etc.

Les origines et les premiers temps de l’open data

« Loin d’être un phénomène récent, l’ouverture des données s’inscrit dans un héritage historique et conceptuel varié comprenant la transparence et le droit d’accès à l’information, la liberté de l’information et le logiciel libre, le partage des données de la recherche, la modernisation des administrations, les industries de l’information et l’entraînement des modèles d’intelligence artificielle », écrit-il, replaçant l’open data dans une histoire qui s’étend sur plus de deux siècles, avec comme point de départ officiel un droit d’accès aux documents publics promulgué en Suède en 1766.

Toutefois, l’histoire de l’open data en tant que mouvement est plus récente, elle remonte aux années 2000 et reste indissociable de celle de l’open source et de la culture du libre. Dans cette mouvance, les acteurs historiques de l’open data ont d’abord posé des jalons juridiques, rappelle l’auteur, avec la définition de licences libres (Utiliser, réutiliser, redistribuer : Open Definition en 2005 par l’Open Knowledge Foundation). Puis, l’attention s’est focalisée sur les principes techniques de l’ouverture des données publiques (structuration des données, formats, interopérabilité, etc.), avec notamment la réunion de Sébastopol en Californie en 2007. Sponsorisée par la Sunlight Foundation, Google et Yahoo!, cette rencontre a rassemblé une trentaine de participants dont l’éditeur Tim O’Reilly (Web 2.0, Government as a platform), Lawrence Lessig (Creative Commons), Aron Swartz (Reddit), Marcia Hoffmann (Electronic Frontier Foubdation) et établi une sorte de guide de l’open government à l’attention des candidats à l’élection américaine de 2008. Barack Obama répondra favorablement à cette initiative et lancera en 2009 une politique d’ouverture des données publiques avec, notamment, le site data.gov

Le poids de la Silicon Valley dans le profil des défenseurs de l’open data, teinte l’ouverture des données publiques d’une culture libertarienne et techno-solutionniste. Ainsi selon Tim O’Reilly, l’État devrait s’effacer jusqu’à devenir une plateforme de mise à disposition de ressources et de données pour que les entreprises et la société civile s’en saisissent et produisent de nouveaux services utiles à la collectivité ou à l’innovation. Il s’appuie sur l’essor des smartphones et des applications mobiles pour soutenir une ubérisation généralisée de l’économie et des monopoles d’État : cartes et GPS, transports en commun, marché immobilier, économie de la réputation, etc.

En parallèle, les utopistes du Web de la première heure défendent une vision démocratique de l’open data : libre circulation des données dans une perspective d’émancipation individuelle par l’accès aux savoirs, démocratie participative, réduction de l’asymétrie d’information entre les citoyens et l’administration, lutte contre la corruption et les inégalités, etc. Parmi eux, Tim Berners Lee avec sa conférence TED « raw data now » et son « 5-star model », mais aussi les acteurs de la Civictech, des ONG, des data-journalistes, des collectifs de citoyens engagés, etc.

Le bilan de l’open data en France

La France va devenir une figure de l’open data dans le monde avec la promulgation de la loi pour une république numérique de 2016 qui a fait de l’ouverture des données publiques une règle par défaut dans les administrations françaises et qui a marqué l’organisation de la première consultation publique en ligne dans le cadre de l’élaboration d’une loi (21 000 contributions). Parmi les success stories de l’open data en France, Samuel Goëta cite nosdeputes.fr, un site du collectif Regards Citoyens, qui rend compte de la réalité du travail des députés de l’assemblée nationale (absentéisme, votes, etc.) ou encore la publication des déclarations de patrimoine et des conflits d’intérêts sur le site de la haute autorité pour la transparence de la vie publique (hatvp.fr).

Cette percée de l’open data en France est le fruit d’un petit noyau d’acteurs pro-numériques, d’entrepreneurs de la tech et de personnalités politiques à l’instar de Daniel Kaplan avec la Fing, de Benoit Thieulin avec Netscouade, du réseau des cantines Silicon Sentier/Numa, de Nicolas Voisin avec Owni.fr dans le sillage de Wikileaks, d’Henri Verdier avec Etalab, de Gilles Babinet avec le CNNum (Conseil National du Numérique), d’Axelle Lemaire, l’autrice de la préface et secrétaire d’État chargée du numérique de 2014 à 2017, de Cédric Villani et son rapport sur l’intelligence artificielle en 2018, des villes pionnières comme Rennes, de projets comme la 27e région, etc. 

Cet enthousiasme pour un renouveau démocratique par les données et la technologie s’est rapidement heurté à la complexité administrative française et au peu d’entrain des responsables politiques au regard des données sensibles qui pourraient être révélées et des incertitudes concernant les impacts économiques promis. Samuel Goëta questionne, ainsi, la pertinence de l’ouverture des données publiques par défaut, décidée par la Loi du 7 octobre 2016 pour une République numérique, alors que personne ne s’est préoccupé de la capacité réelle des administrations à le faire : infrastructures insuffisantes, manque d’interopérabilité, besoin d’acculturation des agents publics, intervention des élus pour bloquer les données considérées comme sensibles au regard de leur carrière, problématique du maintien des données dans le temps, complexité structurelle des demandes d’accès aux données publiques, etc. Par conséquent, « la France est l’un des premiers pays au monde à avoir accordé un droit de savoir à ses citoyens mais en pratique le droit d’accès français est beaucoup plus faible que celui d’autres pays », déplore Samuel Goëta. Ensuite, la focalisation sur les dimensions techniques et juridiques de l’open data a limité la réflexion sur le contenu des données et sur les données essentielles à ouvrir : « Dans les faits, les données ouvertes se révèlent décevantes. (…) Les données sont soit manquantes, soit généralement trop inoffensives pour constituer une véritable machine à scandale et permettre des révélations ». Enfin, il note que les retombées en termes de création d’entreprises et d’emplois dans les territoires ont été largement surévaluées et ont fini par provoquer des déceptions et des reculs en termes de mobilisation des institutions publiques et territoriales, d’autant que l’ouverture des données a un coût pour l’administration. 

L’open data a-t-il pour autant fait pschitt, comme la polémique sur le financement des voyages privés de Jacques Chirac dans les années 1990 ? Pas tout à fait, car le Covid-19 a relancé le besoin de transparence de l’action publique afin d’établir une relation de confiance entre citoyens et gouvernants, et a favorisé le partage de données publiques afin de stimuler l’innovation pour faire face à la crise. Cette confiance a été cruciale pour enrayer l’épidémie : acceptation des gestes barrières, des contraintes de déplacement, acceptation de la vaccination. Et l’open data a permis une co-construction de solutions avec la société civile et les citoyens, à l’instar de l’application Covidtracker ou encore du partage des données pour la fabrication de masques ou autres protections dans les makerspaces et les fablabs.

Open data, le temps du rebond

Après avoir retracé les péripéties de l’open data, Samuel Goëta rappelle ses succès, des communs numériques aujourd’hui incontournables et sources de nombreux services d’utilité collective, à l’instar d’Open Food Facts qui a permis la création de Yuka, et d’Open Street Map qui outille, entre autre, l’aide humanitaire lors de catastrophes naturelles. L’intelligence artificielle se nourrit également de données publiques et ouvre un potentiel de nouvelles applications d’intérêt général. Il constate, en outre, que l’open data a permis une modernisation accélérée de l’administration : amélioration de la qualité des données et de leur structuration, coopération entre administrations et avec les entreprises et citoyens, etc. 

Cependant, il regrette l’instabilité et l’obstruction politiques qui empêchent l’ouverture de nombreuses données et leur maintien dans le temps. Il réclame alors une plus grande indépendance du service public de la donnée ainsi qu’une refondation du droit d’accès aux données publiques. Il propose, ainsi, d’intégrer la Commission d’accès aux documents administratifs (Cada) à la Haute autorité pour la transparence de la vie publique, de sanctionner les refus d’accès lorsqu’ils sont illégitimes, ou encore d’inscrire l’ouverture des données dans les fiches de poste des agents publics.

Il recommande, ensuite, d’élargir l’open data aux données d’intérêt général afin de pallier les données manquantes. Il préconise la création de coopératives de données (par exemple : des consommateurs qui reversent les données de leur carte de fidélité pour mieux évaluer les questions de pouvoir d’achat), ou encore le crowdsourcing de données auprès des citoyens afin d’améliorer des services publics ou éclairer une problématique collective (concertation publique, genre et espace public, défaillances des transports, gestion des déchets, etc.).

Il relève, en outre, le problème de la découvrabilité des données et suggère d’améliorer le référencement des jeux de données, d’intégrer les bases de données publiques (prix immobilier, qualité de l’air) comme ressource dans les médiathèques, de montrer les résultats de l’utilisation de l’open data, à l’image d’un prix de l’open data des territoires, de créer une revue française des données publiques (data papers).
Enfin, il appelle de ses vœux le développement d’une culture des données (data-literacy), arguant qu’on ne peut pas se concentrer uniquement sur l’offre de données, qu’il est tout aussi essentiel de s’assurer « que les citoyens soient capables de comprendre et d’utiliser les données (…) dans un contexte de crise climatique et de déclin de la biodiversité pour obtenir plus de justice et de démocratie, ce n’est pas le moment d’abandonner ». La promesse, véhiculée par l’open data, de transparence de l’action publique et de co-construction de solutions collectives avec les entreprises, associations et citoyens, pourrait effectivement gagner à être orientée sur des objectifs précis, limités et ancrés dans des territoires. Axelle Lemaire évoque, à ce propos dans la préface, le concept de municipalisme numérique, c’est-à-dire d’une structuration territoriale de l’écosystème de l’open data, car « l’échelon local est le plus à même de mobiliser les citoyens autour de projets concrets liés à la vie en collectivité », écrit-elle. Un propos que les acteurs des tiers-lieux ne pourront que confirmer. Des fabriques de territoires aux fabriques de données territoriales, une nouvelle idée de dispositif tiers-lieux pour l’ANCT ?

Cet article est publié en Licence Ouverte 2.0 afin d’en favoriser l’essaimage et la mise en discussion.