Biens communs de données : l'infrastructure manquante pour une intelligence artificielle au service de l'intérêt général
L'« hiver des données » n'est pas seulement un problème technique. C'est une défaillance structurelle. Ce dont nous avons besoin de toute urgence, c'est d'une nouvelle infrastructure : des biens communs de données.
Stefaan Verhulst (cofondateur de The GovLab et The Data Tank, professeur de recherche à la NYU Tandon School of Engineering)
Burton Davis (vice-président et directeur juridique adjoint, groupe Propriété intellectuelle chez Microsoft )
Andrew Schroeder (Vice-président de la recherche et de l'analyse chez Direct Relief )
L'intelligence artificielle est considérée comme la technologie phare de notre époque. De ChatGPT à Copilot et au-delà, les systèmes d'IA générative redéfinissent notre façon de travailler, d'apprendre et de gouverner. Mais derrière ces avancées qui font la une des journaux se cache un problème fondamental : Les données dont dépendent ces systèmes pour produire des résultats utiles servant l’intérêt public sont de plus en plus inaccessibles.
Sans accès à des ensembles de données diversifiés et de haute qualité, les modèles d’IA risquent de renforcer les biais, d’aggraver les inégalités et de fournir des résultats moins fiables et plus imprécis. Pourtant, l'accès aux données reste fragmenté, cloisonné et de plus en plus restreint. Ce qui était autrefois ouvert —les archives gouvernementales, la recherche scientifique, médias publics— est désormais verrouillé par des conditions de propriété, des politiques obsolètes ou une simple négligence. Nous entrons dans un hiver des données alors même que l'influence de l'IA sur la vie publique s'intensifie.
Il ne s’agit pas seulement d’un problème technique. C’est une défaillance structurelle. Ce dont nous avons besoin de toute urgence, c’est d’une nouvelle infrastructure : des communs de données.
Un « bien commun de données » (data commons) est un pool partagé de ressources de données — géré de manière responsable, administré selon des approches participatives et mis à disposition pour être réutilisé dans l’intérêt public. Bien gérés, les communs peuvent garantir que les communautés et autres réseaux aient leur mot à dire sur l’utilisation de leurs données, que les organisations d’intérêt public puissent accéder aux données dont elles ont besoin, et que les avantages de l’IA puissent être mis à profit pour relever les défis sociétaux.
Les biens communs offrent une réponse pratique au paradoxe de la rareté des données au milieu de l’abondance. En mettant en commun les ensembles de données entre les organisations — gouvernements, universités, bibliothèques et autres —, ils font correspondre l’offre de données à la demande réelle, facilitant ainsi la création d’une IA qui réponde aux besoins du public.
Nous observons déjà les premiers signes de ce à quoi pourrait ressembler cet avenir. Des projets tels que Common Corpus, MLCommons, ainsi que l’Institutional Data Initiative montrent comment des institutions diverses peuvent collaborer pour rendre les données à la fois accessibles et responsables. Ces initiatives mettent l’accent sur les normes ouvertes, la gouvernance participative et la réutilisation responsable. Elles remettent en question l’idée selon laquelle les données doivent être soit verrouillées, soit laissées sans protection, en proposant une troisième voie fondée sur des valeurs communes et l’intérêt public.
Mais le rythme des progrès ne correspond pas à l’urgence du moment. Alors que les décideurs politiques débattent de la réglementation de l’IA, ils ignorent souvent l’infrastructure qui rend possible, en premier lieu, les applications d’intérêt public. Sans un meilleur accès à des données de haute qualité et gérées de manière responsable, l’IA au service du bien commun restera davantage une aspiration qu’une réalité.
C’est pourquoi nous lançons le New Commons Challenge— un appel à l’action destiné aux universités, aux bibliothèques, à la société civile et aux technologues afin de construire des écosystèmes de données qui alimentent l’IA d’intérêt public. Cette initiative financera deux projets lauréats à hauteur de 100 000 dollars chacun afin de créer des prototypes de biens communs axés sur des domaines critiques tels que la réponse aux catastrophes et la prise de décision locale. Elle a obtenu le soutien essentiel de leaders dans ces domaines, avec Direct Relief/CrisisReady et l’ Institutional Data Initiative de la bibliothèque de la faculté de droit de Harvard en tant que partenaires et l'UNESCO en tant qu'observateur.
Le New Commons Challenge vise à mettre cette approche structurelle et guidée par la communauté au premier plan. Imaginez des outils d’IA capables d’aider les villes à se préparer aux inondations, à améliorer leur réponse aux crises ou à fournir des conseils contextualisés aux organisations d’intérêt public — non seulement dans les capitales prospères, mais aussi dans les régions défavorisées du monde entier. Ces applications sont possibles—mais seulement si les données appropriées sont disponibles pour les former et les faire fonctionner.
C’est pourquoi les communs de données, et le New Commons Challenge, sont si essentiels.
Si nous voulons une IA qui serve l’intérêt public, nous devons investir dans l’infrastructure qui la rend possible. Un patrimoine commun de données n’est pas une idée utopique. C’est un fondement pratique pour l’innovation qui reflète — et sert — la diversité de l’expérience humaine. Ce patrimoine commun ne se construira pas tout seul. Mais ensemble, nous pouvons le construire à temps.
Ce contenu a été traduit automatiquement avec DeepL.