L'incubateur New Commons

Exemple de programme

Vous trouverez ci-dessous un exemple de modules proposés dans le cadre du programme d'incubation New Commons. Ces modules sont conçus pour être dispensés sur une période de six mois. Chaque module combinera des séminaires animés par des experts et des sessions de travail en équipe structurées, aboutissant à une proposition susceptible d’être financée et à une feuille de route opérationnelle. Le contenu des modules sera adapté pour refléter les besoins et la composition de chaque promotion, en coordination avec notre comité de pilotage composé d’experts en langues autochtones.

Modules
  1. Cerner l'opportunité/le défi

    Objectif

    Définissez le cas d'utilisation spécifique de l'IA, justifiez la nécessité d'un bien commun de données (data commons) et ancrez cette initiative dans la souveraineté des peuples autochtones en matière de données dès le premier jour.

    Thèmes principaux
    • Les biens communs de données à l'ère de l'IA : pourquoi ils sont importants pour les langues autochtones disposant de peu de ressources
    • À quoi ressemblent les applications d'IA pour les langues autochtones : reconnaissance vocale (ASR), synthèse vocale, traduction automatique, affinage des modèles de langage (LLM) et recherche — et quelles sont les exigences de chacune en matière de données et de gouvernance
    • Définition du problème et maîtrise de la formulation des questions : passer d'un défi général à des priorités réalisables
    • La souveraineté des peuples autochtones en matière de données et les principes CARE (intérêt collectif, pouvoir de contrôle, responsabilité, éthique)
    • Prendre en compte les besoins, les valeurs et l'histoire des peuples autochtones comme fondement — et non comme une simple considération secondaire
  2. Définir les avantages pour la communauté et l'acceptabilité sociale

    Objectif

    Mettre en œuvre le principe CARE du « bien commun » avant de prendre des décisions techniques ou relatives aux données, afin de garantir que les applications d'IA soient au service des communautés autochtones et ne les exploitent pas.

    Thèmes principaux
    • Comment les applications d'IA peuvent renforcer ou compromettre les objectifs des communautés autochtones : exemples concrets et lignes rouges
    • Mécanismes de participation communautaire et protocoles de consultation adaptés aux différents contextes autochtones
    • L'acceptation sociale pour la réutilisation des données et le développement de l'IA : à quoi ressemble concrètement un consentement significatif et continu
    • Autodétermination, avantages économiques et modèles d'appropriation communautaire pour la valeur générée par l'IA
    • Facteurs contextuels : droits fonciers, traumatismes intergénérationnels, politique linguistique et confiance dans les institutions
  3. Cartographie du paysage des données : offre, risques et diligence raisonnable

    Objectif

    Identifier et évaluer les données nécessaires au bon fonctionnement des biens communs, en accordant une attention particulière aux risques, aux implications juridiques et aux vérifications préalables requises avant toute collecte ou tout partage de données.

    Thèmes principaux
    • Ce dont les applications d'IA ont réellement besoin : types de données et de langages (audio, texte, métadonnées, annotations), volumes minimaux, seuils de qualité et normes de format pour l'IA en langues autochtones
    • Les principes FAIR-R et la préparation à l'IA pour les données linguistiques issues de contextes à faibles ressources
    • Évaluation des risques : identification des risques culturels, juridiques, de réputation et techniques liés à des ensembles de données, des partenaires et des cas d'utilisation de l'IA spécifiques
    • Due diligence dans le cadre des partenariats en matière de données : évaluation des détenteurs potentiels de données sur la provenance, l'historique des consentements, l'autorisation de la communauté et la conformité aux principes de l'IDS
    • Obstacles juridiques et liés à la gouvernance : droits d'auteur, propriété intellectuelle communautaire, contrôle institutionnel de l'accès et considérations relatives aux données transfrontalières
    • Approches basées sur le minimum de données viables : comment créer des outils d'IA utiles sans attendre de disposer d'ensembles de données parfaits
  4. Concevoir la gouvernance et la responsabilité

    Objectif

    Concevoir des modèles de gouvernance qui intègrent la souveraineté des peuples autochtones en matière de données, définissent qui contrôle la conception des IA et garantissent une collaboration fiable et durable.

    Thèmes principaux
    • La gouvernance de l'IA en tant que gouvernance autochtone : qui décide quels modèles sont entraînés, à partir de quelles données et à quelles fins — et qui peut en révoquer l'accès ?
    • Modèles de gouvernance collective pour les biens communs de données : structures, droits de décision et mécanismes de responsabilité
    • Rôles et responsabilités en matière de gestion des données tout au long du cycle de vie des données
    • Autorité, légitimité et contrôle : modèles d'accès à plusieurs niveaux, droits de veto communautaires et clauses de caducité
    • Intégrer la gestion des risques dans la gouvernance : traduire le registre des risques en politiques contraignantes, en droits d'audit et en processus de correction
  5. Architecture technique et conception d'applications d'IA

    Objectif

    Concevoir l'infrastructure technique nécessaire pour créer, gérer et exploiter les biens communs, ainsi que pour alimenter les applications d'IA de manière à ce que les communautés puissent les contrôler et les pérenniser.

    Thèmes principaux
    • Types d'applications d'IA pour les langues autochtones : reconnaissance vocale (ASR), synthèse vocale (TTS), traduction automatique, ajustement des modèles de langage (LLM) et génération augmentée par la recherche (RAG) — exigences techniques et implications pour les communautés pour chacune d'entre elles
    • Options d'architecture technique : modèles centralisés, fédérés et sur site, conformes aux principes de souveraineté
    • Contrôles d'accès aux données qui traduisent les décisions de gouvernance : licences gérées par la communauté, API à plusieurs niveaux d'accès et journaux d'audit
    • Normes interopérables, schémas et vocabulaires communs pour les données relatives aux langues autochtones
    • Outils et frameworks open source : ce qui existe, les lacunes qui subsistent et comment renforcer les capacités au niveau local
  6. Durabilité, financement et mise en œuvre

    Objectif

    Élaborer une stratégie viable et susceptible d'être financée pour assurer un fonctionnement à long terme, une stratégie ancrée dans la réalité institutionnelle et non dans une logique de projet pilote à court terme.

    Thèmes principaux
    • Transformer l'incubateur en projet de financement : ce que les bailleurs de fonds attendent (clarté du problème, légitimité auprès de la communauté, viabilité technique, rigueur en matière de gouvernance et durabilité)
    • Paysage du financement : modèles philanthropiques, du secteur public, multilatéraux (UNESCO, ONU) et générateurs de revenus pour les biens communs de données de la langue et de la culture autochtones
    • Modèles de durabilité : hébergement institutionnel, appropriation par la communauté et revenus générés par les applications d'IA
    • Incitations et obstacles institutionnels : qu'est-ce qui motive les universités, les gouvernements et les entreprises technologiques à participer — et qu'est-ce qui les en empêche ?
    • Évolutivité et réplication : concevoir dès le départ pour une adoption plus large au sein des communautés linguistiques
Prêt à commencer ?

Créez votre proposition susceptible d'être financée.

Ce programme de six mois vous accompagne depuis la définition de votre opportunité jusqu'à l'élaboration d'une proposition susceptible d'obtenir un financement et d'une feuille de route opérationnelle. Postulez pour intégrer votre idée de biens communs de données à la promotion.