Lancement : un plan d'action pour créer de nouveaux pools de données communs destinés à l'intelligence artificielle
Afin d'accélérer la création de pools de données communs, The Open Data Policy publie aujourd'hui « A Blueprint to Unlock New Data Commons for AI » (Un plan d'action pour créer de nouveaux pools de données communs destinés à l'IA) — un guide expliquant comment gérer les données afin de créer des pools de données communs permettant des cas d'utilisation de l'IA d'intérêt public.
Dans le paysage de l'IA en constante évolution d'aujourd'hui, il est essentiel d'élargir l'accès à des données variées et de haute qualité afin de garantir que les applications d'IA puissent servir toutes les communautés de manière équitable. Pourtant, nous sommes au bord d’un «hiver des données» potentiel, où des ressources de données précieuses susceptibles de servir l’intérêt général sont de plus en plus verrouillées ou inaccessibles.
Les communs de données — des écosystèmes gérés de manière collaborative qui permettent le partage responsable d’ensembles de données diversifiés entre les secteurs — offrent une solution prometteuse. En mettant en commun les données selon des normes claires et une gouvernance partagée, les communs de données peuvent libérer le potentiel de l’IA au service de l’intérêt général tout en garantissant que son développement reflète la diversité des expériences et des besoins de la société.
Afin d’accélérer la création de communs de données, The Open Data Policy publie aujourd’hui «Un plan d’action pour créer de nouveaux biens communs de données pour l’IA”—un guide sur la manière de gérer les données afin de créer des biens communs de données permettant des cas d’utilisation de l’IA d’intérêt public.
Co-rédigé par Hannah Chafetz, Andrew J. Zahuranec et Stefaan Verhulst, ce document vise à aider les bibliothèques, les universités, les centres de recherche et d’autres détenteurs de données (par exemple, les gouvernements et les organisations à but non lucratif) à travers quatre modules :
-
Cartographier l'offre et la demande : Comprendre pourquoi les systèmes d'IA ont besoin de données, quelles données peuvent être mises à disposition pour former, adapter ou améliorer l'IA, et à quoi pourrait ressembler un prototype viable de communs de données intégrant les besoins et les valeurs des parties prenantes ;
-
Débloquer la gouvernance participative : Concevoir conjointement les aspects clés de la plateforme de données partagées avec les principales parties prenantes et consigner ces aspects dans un accord formel ;
-
Construire le patrimoine commun: Mettre en place le patrimoine commun de données d'un point de vue pratique et veiller à ce que toutes les parties prenantes soient incitées à le mettre en œuvre ; et
-
Évaluation et itération: Évaluer le fonctionnement du patrimoine commun et procéder à des itérations si nécessaire.
Ces modules s’appuient en outre sur deux taxonomies supplémentaires. La « Taxonomie des types de données » fournit une liste des types de données pouvant s’avérer utiles pour les cas d’utilisation de l’IA générative d’intérêt public. La « Taxonomie des cas d’utilisation » présente les applications d’IA générative d’intérêt public pouvant être développées selon une approche de biens communs de données, ainsi que les résultats possibles et les parties prenantes concernées.
Un ensemble distinct de fiches de travail peut être utilisé pour guider davantage les organisations dans le déploiement de ces outils.
Nous espérons que ces ressources constitueront un point de départ utile pour les organisations qui souhaitent exploiter des données pouvant être mises à profit pour l’IA générative au service de l’intérêt général. Ce plan d’action est conçu comme un document évolutif qui sera mis à jour au fil du temps afin de refléter les nouveaux développements et les nouvelles perspectives dans ce domaine en constante évolution.
N'hésitez pas à nous contacter à l'adresse datastewards@thegovlab.org si vous utilisez l'un de ces documents ou l'un de nos autres outils pour soutenir votre travail ou si vous avez des questions. Vous souhaitez rester informé des prochaines publications ? Inscrivez-vous ICI.
Ce contenu a été traduit automatiquement avec DeepL.