Foire aux questions Questions.
Informations sur les biens communs de données (data commons), l'incubateur New Commons et l'accent mis actuellement sur les langues et cultures autochtones. Vous avez encore des difficultés ? Envoyer un e-mail à l'équipe.
Contexte
Ce que sont les biens communs de données, les problèmes qu'ils visent à résoudre et des exemples d'initiatives existantes.
Les biens communs de données sont des écosystèmes de données gérés de manière collaborative, conçus pour mettre en commun et offrir un accès responsable (et réglementé) à des ensembles de données variés et de haute qualité provenant d'un ou de plusieurs secteurs, afin de permettre le développement et le déploiement d'applications d'IA générative répondant à des enjeux d'intérêt public.
Cette approche se distingue en ce qu’elle traite les données comme une ressource partagée régie par une communauté plutôt que contrôlée uniquement en tant que propriété individuelle ou institutionnelle. Elle reconnaît en outre que les données ouvertes, ouvertes par défaut et souvent entièrement publiques, n’offrent pas à elles seules une solution complète. Dans un paysage des données en constante évolution, pour garantir que l'ouverture soutienne les objectifs d'intérêt public, il faut s'interroger sur la manière dont la reconnaissance et les bénéfices sont répartis, en particulier lorsque les données accessibles au public peuvent être largement réutilisées sans que les communautés qui les gèrent n'en retirent de bénéfices clairs. Elles peuvent soutenir, par exemple, le développement responsable de l'IA, l'adaptation au changement climatique et la conservation de la biodiversité, la santé publique et la préparation aux pandémies, l'agriculture durable, la recherche scientifique, la réponse aux catastrophes, ainsi que la préservation, la revitalisation et la gestion responsable des savoirs, des langues, du patrimoine culturel et des économies de données autochtones.
Vous trouverez plus de détails sur les biens communs de données ici.
Les biens communs de données visent à remédier à plusieurs défaillances structurelles :
- Asymétries d'accès : De nombreuses grandes organisations cherchent à utiliser les données ouvertes pour tirer profit de celles des autres tout en limitant l'accès à leurs propres données propriétaires. Les biens communs de données peuvent mettre en place des mécanismes permettant aux communautés d'influencer qui accède à leurs données, comment et dans quel but.
- Échecs de coordination : Le partage de données avec un seul acteur ou de manière ponctuelle entraîne souvent des coûts de transaction élevés (par exemple, la formulation d'accords de partage de données sur mesure, de normes). Les biens communs de données peuvent créer des processus plus standardisés pour le partage des données selon des règles cohérentes.
- Manque de confiance : Dans de nombreux accords de partage de données, les intérêts et les attentes du public ou des communautés contributrices ne sont pas pris en compte de manière significative. Cela érode la acceptabilité sociale et limite la légitimité de toute (ré)utilisation des données. Les biens communs de données cherchent à placer ces préoccupations au centre des préoccupations par le biais de la gouvernance, de la surveillance et des conditions d'accès.
- Sous-utilisation : L'un des problèmes qui entravent la réutilisation des données est que les ensembles de données les plus précieux ne sont pas utilisés pour le bien public, mais font l'objet de restrictions. Les biens communs de données peuvent élargir l'accès à un ensemble plus large d'acteurs à condition qu'ils s'engagent à respecter les normes définies par les organisateurs.
De cette manière, les biens communs de données peuvent ouvrir la voie à des relations de partage de données plus durables et plus équitables pour le bien public. Elles peuvent répondre à certaines des préoccupations qui alimentent la pénurie de données et l’actuel « hiver des données ». Elles peuvent recentrer le débat sur l’IA afin de mettre l’accent sur l’IA d’intérêt public et la prise de décision.
Nos recherches montrent que les biens communs de données ont tendance à présenter un ensemble de caractéristiques couramment mises en œuvre qui reflètent l'état actuel du domaine :
- Objectif public : Vise à fournir les données nécessaires pour résoudre des problèmes publics et développer une IA d'intérêt public.
- Gouvernance participative : Dispose d’une structure de gouvernance offrant aux membres du bien commun des moyens concrets d’exercer leur pouvoir d’action sur l’utilisation de leurs données.
- Mécanismes de responsabilité : Contrôle en permanence la mise en œuvre des règles du bien commun. Dispose de systèmes pour gérer les litiges et demander des comptes à ceux qui ne respectent pas les règles.
- Avantages pour les contributeurs : Offre des avantages clairs aux parties prenantes qui ont contribué au bien commun. Il peut s’agir d’avantages financiers, d’un accès anticipé aux outils d’IA ou aux recherches développées, de la mention de leur contribution, d’informations les concernant, d’une adhésion gratuite, d’un accès à l’infrastructure pour développer de nouveaux outils d’IA, etc.
- Contrôles d'accès : Comprend des règles clairement définies régissant comment, quand et par qui les ensembles de données peuvent être consultés et utilisés. Cela peut impliquer des cadres standardisés tels que les licences Creative Commons, ainsi que des modèles d'accès à plusieurs niveaux, restreints ou basés sur le consentement.
- Financement et soutien : Le bien commun de données est souvent financé en tant que bien public, généralement avec le soutien du gouvernement, d'organismes philanthropiques ou via un modèle d'adhésion/coopératif.
Les biens communs de données constituent une pratique émergente. Peu d'initiatives existantes répondent pleinement à la définition de systèmes gérés de manière collaborative, dans lesquels les communautés exercent un pouvoir sur les données. Au contraire, les exemples actuels couvrent un large éventail de modèles qui intègrent certaines caractéristiques propres aux biens communs, telles que l'accès partagé, la participation multipartite ou l'orientation vers l'intérêt public, sans pour autant toujours mettre en œuvre une gouvernance collective. Les initiatives ci-dessous illustrent cette diversité :
- CLARIN: CLARIN fournit l'infrastructure permettant de combiner les données linguistiques provenant de diverses institutions européennes à des fins de recherche. La gouvernance est multipartite au niveau institutionnel, mais le pouvoir décisionnel est exercé par les États membres et les organisations plutôt que par une communauté de contributeurs plus large.
- Common Voice: Common Voice est un ensemble de données vocales ouvertes issues du crowdsourcing qui peut être utilisé pour entraîner des applications vocales basées sur l'IA. Cette initiative vise à élargir l'accès aux données vocales pour les langues non anglophones et d'autres groupes généralement sous-représentés dans les ensembles de données vocales. Elle est menée par la Fondation Mozilla.
- Language Data Commons of Australia: Le projet « Language Data Commons of Australia » est un partenariat entre l'Australian Research Data Commons et la School of Languages and Cultures de l'université du Queensland, qui vise à mettre à disposition des données linguistiques australiennes à des fins « académiques et non académiques ».
- Querido Diário: Open Knowledge Brasil cherche à développer un bien commun de données pour les journaux officiels municipaux. Sa plateforme Querido Diário vise à rendre ces ensembles de données accessibles et à faciliter l’analyse des informations qu’ils contiennent. L’objectif est d’améliorer la prise de décision au niveau local au Brésil.
- Malawi Voice Data Commons: Le programme Malawi Voice Data Commons du NYU Peace Research and Education Program, développé en collaboration avec Ushahidi, le PNUD et la Fondation Mozilla, permet aux habitants des zones rurales du Malawi de signaler des situations d’urgence dans leur langue maternelle, créant ainsi des ensembles de données multilingues et compatibles avec l’IA pour les interventions humanitaires et la préservation des langues. Le projet pilote se déroulera au Malawi et devrait ensuite être étendu à l'ensemble de l'Afrique subsaharienne.
À propos de l'incubateur
Les objectifs de l'incubateur, les avantages pour les participants, les dates limites, les conditions d'éligibilité et l'évaluation.
L'incubateur New Commons est un programme structuré destiné à aider les individus et les équipes à élaborer des propositions détaillées et concrètes pour la création de biens communs de données à l'ère de l'IA.
Il aborde une question cruciale : la capacité limitée des communautés à avoir leur mot à dire sur la manière dont leurs données sont utilisées ou à tirer un bénéfice significatif de cette utilisation. En créant et en améliorant les biens communs de données, qui sont des écosystèmes de données gérés de manière collaborative et qui regroupent et fournissent un accès responsable à des ensembles de données diversifiés et de haute qualité, il est possible de combler le fossé dans le développement de l'IA.
Grâce à ce programme, vous rejoindrez un groupe de pairs pour participer à diverses activités d'apprentissage entre pairs, à des opportunités de réseautage et à des formations dispensées par des experts de renommée internationale. Bien que l'Incubateur n'offre pas de soutien financier direct, nous nous efforcerons de transformer votre idée de biens communs de données en un concept (et une proposition) viable pouvant être présenté à des bailleurs de fonds capables de le développer à plus grande échelle.
Grâce au programme Incubateur, les participants pourront :
- Entrer en contact avec une communauté internationale de gestionnaires de données ;
- Réseauter avec des bailleurs de fonds et leur présenter leur travail ;
- Travailler avec des experts pour élaborer un plan solide visant à mettre en place un bien commun de données ;
- Participer à des sessions de formation pertinentes sur plusieurs thèmes, notamment la conception de cadres de gouvernance, la mise en place de licences sociales et la constitution d'ensembles de données prêts pour l'IA ; et
- Faire examiner leurs propositions par des experts du secteur et leurs pairs.
Les participants ne recevront pas de financement directement de Microsoft, de l'UNESCO ou de The GovLab — bien que nous nous efforcions de mettre les participants en relation avec des bailleurs de fonds à la fin du programme. L'incubateur ne fournira pas d'infrastructure informatique ni de données pour le bien commun de données proposé.
Nous ne demanderons aucune donnée aux participants et toutes les données et tous les documents resteront la propriété exclusive des candidats.
- Ouverture des candidatures : 19 juin 2026
- Clôture des candidatures : 14 août 2026 à 23:59 ET
- Sélection des participants : Fin août 2026
- Lancement : Mi-septembre 2026
- Programmation virtuelle : Octobre 2026 – avril 2027
- Vitrine : Avril 2027
Les participants à l'Incubateur pour les langues et cultures autochtones doivent être autochtones ou avoir un lien reconnu avec les communautés autochtones. Au cours du processus de candidature, nous veillerons à ce que les candidats disposent des ressources nécessaires pour mettre en place un bien commun de données capable de protéger efficacement les intérêts de leur communauté et de garantir une répartition équitable des bénéfices.
Toutes les propositions doivent satisfaire à des exigences minimales. Les candidats qui remplissent ces conditions seront évalués par un jury d'experts (issus du comité de pilotage ou approuvés par celui-ci). Les juges seront invités à évaluer les propositions à l'aide d'une grille d'évaluation qui examine des critères spécifiques. Les questions figurant dans la colonne de gauche seront incluses dans le formulaire de candidature afin d'indiquer clairement ce que les juges attendent précisément pour chaque catégorie.
Chaque proposition sera examinée par trois juges. Les notes seront moyennées et les propositions ayant obtenu les meilleures notes seront transmises au comité de pilotage collectif. Nous veillerons à l'équité et nous nous efforcerons de faire en sorte que toutes les propositions soient évaluées par le même nombre de juges. Si tous les juges ne soumettent pas de notes et que certaines candidatures ne font l'objet que de deux évaluations au lieu de trois, nous retirerons la note la plus basse de toute proposition ayant été évaluée par trois juges avant de calculer la moyenne.
En collaboration avec le comité de pilotage, les organisateurs de l'incubateur mèneront une vérification préalable des candidats ayant obtenu les meilleures notes afin de s'assurer qu'ils entretiennent chacun une relation solide avec la communauté autochtone qu'ils ont l'intention de servir. L'équipe du projet veillera à ce que les propositions soient examinées par des experts de la région concernée, capables d'évaluer correctement si cette relation est solide.
Sauf circonstances atténuantes (par exemple, l'impossibilité de confirmer le soutien de la communauté ou leurs propres références), les équipes seront alors invitées à rejoindre la cohorte. Si un participant se retire, le participant suivant le mieux classé sera invité à le remplacer.
Règles et normes
Les normes éthiques, le rôle de chaque acteur, les principes fondamentaux de la prise de décision et la portée mondiale.
À l'attention des participants :
Tous les participants doivent aligner leurs propositions de biens communs de données sur les principes de souveraineté des données autochtones. Si un participant refuse d'aligner son travail sur les principes de souveraineté des données autochtones, il sera immédiatement prié de quitter le programme. Cela inclut, sans s'y limiter :
- L'inclusion de données non autorisées dans le domaine public ;
- L'activation du domaine public sans la licence sociale nécessaire à son fonctionnement ;
- Ne pas reconnaître les lois autochtones, les obligations découlant des traités et d’autres normes ; et
- Proposer un accès aux données dans un format qui ne serait pas conforme à la gouvernance autochtone.
Afin d’atténuer ce risque, lors de l’examen des candidatures, nous demanderons au jury de vérifier si le projet est conforme aux principes de souveraineté des Autochtones en matière de données. Nous soumettrons ces normes au comité de pilotage. Nous modifierons ce protocole s’il identifie des principes fondamentaux ou des obligations manquants.
À l’attention de l’équipe de projet :
L'équipe de projet adhère aux principes CARE pour la gouvernance des données autochtones. Cela signifie qu'elle veillera à tout moment à garantir :
- Avantage collectif : L'équipe s'efforcera de concevoir l'incubateur de manière à garantir que les peuples autochtones puissent tirer profit des données. Sous la houlette du comité de pilotage, elle sélectionnera les propositions qui démontrent un souci de résultats justes et équitables, d’une gouvernance améliorée et de l’engagement citoyen. Les supports de formation de l’incubateur favoriseront des résultats similaires.
- Autorité de contrôle : L’Incubateur reconnaît les droits et les intérêts des peuples autochtones sur les données autochtones et cherche à leur donner les moyens de contrôler leurs propres données. Reconnaissant ces droits et intérêts, les membres de l’équipe du projet ne demanderont jamais de données aux participants ni ne leur imposeront l’utilisation de systèmes spécifiques. Le modèle de biens communs de données vise à offrir une alternative aux cadres existants en matière de données ouvertes en remédiant aux asymétries d’accès, en permettant aux participants autochtones de décider eux-mêmes à qui ils souhaitent mettre leurs données à disposition, dans quelles conditions et à quelles fins.
- Responsabilité : L’équipe du projet Incubator reconnaît qu’il lui incombe de communiquer sur la manière dont elle soutiendra l’autodétermination et l’intérêt collectif des peuples autochtones. Nous cherchons à favoriser des relations positives en nous imposant des limites précises et en utilisant cette initiative de renforcement des capacités pour soutenir le développement d’une main-d’œuvre autochtone spécialisée dans les données, capable de contrôler ses propres données. Nous nous engageons à travailler avec le comité de pilotage autochtone et les équipes participantes individuelles afin de garantir que tout le soutien que nous offrons s’appuie sur la vision du monde, les expériences vécues, les valeurs et les principes des peuples autochtones.
- Éthique : Bien que l’Incubateur ne traite pas directement de données, l’un de nos axes prioritaires est de promouvoir l’utilisation éthique des données à toutes les étapes de leur cycle de vie et à travers l’écosystème des données. Nous travaillerons avec notre comité de pilotage pour remédier aux déséquilibres de pouvoir et utiliserons notre présentation finale pour tenter de remédier aux déséquilibres en matière de ressources. Tout matériel que nous utiliserons et qui s'inspire des savoirs traditionnels fera appel aux étiquettes de savoirs traditionnels. Toutes les formations reconnaîtront et mettront proactivement en avant les droits de tous les peuples, cultures et savoirs autochtones. L’ensemble de notre travail s’alignera sur la Déclaration des Nations Unies sur les droits des peuples autochtones.
Vous trouverez dans la section ci-dessous des détails sur la répartition des rôles et des responsabilités entre chacune des organisations parrainant cet incubateur.
Le comité de pilotage
Le comité de pilotage est un groupe d'experts autochtones et de représentants communautaires qui ont été invités à diriger l'ensemble des activités de l'incubateur. Alors que l'équipe du projet (The GovLab, l'UNESCO et Microsoft) propose des approches, nous comptons sur le comité de pilotage pour co-concevoir ce travail, en veillant à ce qu'il reste en phase avec les priorités de la communauté, le contexte culturel et les normes éthiques. Ce travail peut impliquer :
- Orientation stratégique et élaboration de modèles : Contribuer à l'incubation de modèles reproductibles, ancrés dans les contraintes du monde réel et adaptables à différents contextes.
- Examiner et valider les ressources fondamentales : Fournir un retour d'information sur les projets de ressources de l'Incubateur afin de garantir leur alignement sur les priorités de la communauté, leur prise en compte des dynamiques culturelles et régionales, et leur respect de normes éthiques rigoureuses.
- Évaluation contextuelle et sélection : Participer à l'examen des candidatures, en veillant à ce que les propositions soient évaluées avec une compréhension éclairée des défis et des opportunités locaux.
- Définir l'engagement et la visibilité : Contribuer à définir comment vous-même et d'autres acteurs devriez être impliqués et comment vos contributions devraient être reconnues publiquement, de manière significative et appropriée.
Équipe de projet
Les partenaires du projet — The GovLab de l'université de New York (NYU), l'UNESCO et Microsoft — agissent en tant que principaux facilitateurs de ce travail, en mettant en commun des ressources, des connaissances et une expertise sous la direction du comité de pilotage. S'appuyant sur leur expertise unique, les membres de l'équipe de projet participeront aux activités suivantes :
The GovLab : S'appuyant sur une décennie d'expérience dans la conception et la gestion de collaborations innovantes et responsables en matière de données, ainsi que sur la constitution d'un groupe de gestionnaires de données, le GovLab dirigera tous les efforts visant à développer des formations, à identifier des ressources et à recruter des intervenants externes pertinents. Il apportera un soutien direct aux équipes dans la conception de programmes, la définition de cadres de gouvernance et d'évaluation, et la recherche de financements. Il veillera tout particulièrement à concevoir des supports pertinents et respectueux des communautés autochtones et de leurs savoirs traditionnels. Nous utiliserons les étiquettes TK et veillerons à ce que toutes les activités de l'incubateur soient conformes aux principes CARE (tels que décrits dans la section 7).
UNESCO : L’UNESCO apporte une légitimité multilatérale, un pouvoir de mobilisation et un mandat normatif unique en tant qu’agence chef de file des Nations Unies en matière de multilinguisme, de culture, de science ouverte, de gouvernance des données et d’éthique de l’IA. L’Incubateur s’ancrera dans le Secteur des politiques numériques et de la transformation numérique de l’UNESCO et dans son initiative sur la gouvernance des données à l’ère numérique, qui font progresser la liberté d’expression, le développement des médias, l’éducation aux médias et à l’information, l’accès universel à l’information et la préservation du patrimoine documentaire, tout en promouvant des approches de la transformation numérique centrées sur l’humain et fondées sur les droits.
En tant qu’agence chef de file des Nations Unies pour la Décennie internationale des langues autochtones (IDIL 2022–2032), l’UNESCO coordonne les efforts mondiaux visant à sauvegarder, revitaliser et promouvoir les langues autochtones et les systèmes de connaissances qui y sont associés. S'appuyant sur des relations de longue date avec les communautés autochtones, les États membres de l'ONU et les institutions culturelles et de mémoire, l'UNESCO mettra en relation les équipes de l'Incubateur avec les partenaires concernés, fournira des orientations stratégiques et soutiendra les actions de sensibilisation communautaire ancrées dans la culture. Elle veillera également à ce que les travaux de l’Incubateur s’inscrivent dans le droit fil des initiatives plus larges des Nations Unies en matière d’inclusion numérique et de langues, notamment l’IDIL et ses plans d’action associés, et y contribuent.
Microsoft : Microsoft est une entreprise technologique mondiale qui possède une expérience dans le soutien d’initiatives de données d’intérêt public et d’efforts en matière d’IA responsable. La participation de Microsoft à l’Incubateur sera dirigée par l’équipe Open Innovation, qui se concentre sur la promotion des données ouvertes et les biens communs de données ainsi que sur la promotion de données accessibles et réutilisables pour relever les défis sociétaux.
Microsoft apportera son expertise sur demande, notamment pour examiner les propositions, offrir des conseils sur la gouvernance des données, la préparation à l’IA, la réutilisation responsable des données, les considérations de conception technique et les éventuelles exigences en matière d’infrastructure. L'objectif de ce soutien est d'aider les participants à comprendre les options et les plans pour une mise en œuvre future, plutôt que d'exploiter, d'héberger, de construire ou de fournir des ressources pour le bien commun de données lui-même.
L'équipe de projet n'agira pas en tant que représentante des communautés autochtones. Elle travaillera avec le comité de pilotage pour prendre des précautions actives afin de garantir que l'ensemble du travail reste la propriété des équipes individuelles et que celles-ci, ainsi que les communautés qu'elles représentent, conservent une pleine autonomie et le contrôle total de leurs informations.
Bien que ce projet vise à développer des compétences et non des biens communs de données directement, nous ne demanderons jamais de données. Nous respecterons une confidentialité stricte tout au long des différentes phases de cet incubateur. Nous n'autoriserons l'accès à aucune proposition des participants ni à aucune donnée communautaire, sauf à des fins de soutien direct au programme. Aucune donnée communautaire ni aucun contenu de proposition ne sera consulté, conservé ou utilisé par l'équipe du projet à des fins commerciales pendant ou après le programme. Toutes les soumissions et tous les documents connexes des candidats et des participants seront détruits après le rapport final.
Sur le plan institutionnel, chacune des organisations membres de l'équipe du projet reconnaît et adhère aux principes de diversité, de transparence, de responsabilité et de promotion de l'équité. Nous cherchons à placer le bien public au centre de nos préoccupations, ce qui inclut l'autonomisation des groupes défavorisés et la promotion de l'inclusion et de l'égalité des chances.
Pour cet incubateur, nous accordons la priorité à deux principes organisateurs lorsqu'il s'agit de prendre des décisions importantes concernant cet incubateur :
- Avantages partagés : Ce travail doit servir à aider les communautés autochtones à mieux exploiter les données dont elles disposent à leur propre profit. Nous veillons à ne pas aggraver les déséquilibres de pouvoir et tiendrons compte du contexte moral, politique, juridique et économique spécifique afin de garantir une répartition équitable des avantages.
- Dirigé par les Autochtones : L'équipe du projet reconnaît la nécessité pour les peuples autochtones de prendre des décisions concernant leurs propres communautés et leurs propres données. Nous définirons les critères de candidature et travaillerons avec le comité de pilotage pour garantir que les équipes du projet puissent parler au nom des communautés qu'elles prétendent représenter. Nous nous tournerons vers le comité de pilotage pour obtenir des conseils sur toutes les ressources et le programme de formation afin de garantir que le travail soit utile, pertinent et intègre les connaissances et les orientations déjà développées et adoptées par les communautés autochtones dans d’autres contextes (par exemple, les principes CARE, Étiquettes de savoirs traditionnels).
Cet incubateur ne peut pas inclure ni représenter toutes les langues, d'autant plus qu'il en existe des milliers à travers le monde. Nous préférons donc laisser cet incubateur ouvert à toute communauté autochtone et y inclure les personnes intéressées par une participation qui répondent à nos critères de candidature.
Une fois que nous aurons constitué le groupe final, nous veillerons à ce que les ressources soient utiles et pertinentes pour les personnes sélectionnées.