Programa de ejemplo
A continuación se presenta un conjunto de módulos de ejemplo para el programa de incubadora New Commons. Estos módulos están diseñados para impartirse a lo largo de seis meses. Cada módulo combinará seminarios impartidos por expertos con sesiones estructuradas de trabajo en equipo, y culminará con una propuesta financiable y una hoja de ruta operativa. El contenido de los módulos se adaptará para reflejar las necesidades y la composición de cada promoción, en coordinación con nuestro comité directivo de expertos en lenguas indígenas.
Planteamiento de la oportunidad/el reto
ObjetivoDefine el caso de uso concreto de la IA, justifica la necesidad de un bien común de datos (data commons) y asienta la iniciativa en la soberanía de los datos indígenas desde el primer momento.
Temas principales- Bienes comunes de datos en la era de la IA: por qué son importantes para las lenguas indígenas con pocos recursos
- Cómo son las aplicaciones de IA para las lenguas indígenas: reconocimiento de voz (ASR), conversión de texto a voz, traducción automática, ajuste de modelos de lenguaje grande (LLM) y búsqueda, y qué requisitos de datos y gobernanza exige cada una de ellas
- Definición del problema y formulación clara de las preguntas: pasar de un reto general a prioridades manejables
- La soberanía de los datos indígenas y los principios CARE (beneficio colectivo, autoridad de control, responsabilidad y ética)
- Entender las necesidades, los valores y la historia de los pueblos indígenas como punto de partida, y no como algo secundario
Establecimiento del beneficio para la comunidad y la aceptación social
ObjetivoAplicar el principio CARE del «beneficio colectivo» antes de tomar decisiones técnicas o relacionadas con los datos, garantizando que las aplicaciones de IA estén al servicio de las comunidades indígenas y no se aprovechen de ellas.
Temas principales- Cómo las aplicaciones de IA pueden reforzar o socavar los objetivos de las comunidades indígenas: ejemplos concretos y límites que no deben traspasarse
- Mecanismos de participación comunitaria y protocolos de consulta adecuados a los distintos contextos indígenas
- Las licencias sociales para la reutilización de datos y el desarrollo de la inteligencia artificial: cómo se traduce en la práctica un consentimiento significativo y continuo
- Autodeterminación, beneficios económicos y modelos de propiedad comunitaria para el valor generado por la IA
- Factores contextuales: derechos sobre la tierra, trauma intergeneracional, políticas lingüísticas y confianza en las instituciones
Análisis del panorama de los datos: suministro, riesgos y diligencia debida
ObjetivoIdentificar y evaluar los datos necesarios para respaldar los bienes comunes, prestando especial atención a los riesgos, la exposición legal y la diligencia debida requerida antes de incorporar o compartir cualquier dato.
Temas principales- Lo que realmente requieren las aplicaciones de IA: datos y tipos de lenguaje (audio, texto, metadatos, anotaciones), volúmenes mínimos, umbrales de calidad y estándares de formato para la IA en lenguas indígenas
- Los principios FAIR-R y la preparación para la IA en el caso de datos lingüísticos con pocos recursos
- Evaluación de riesgos: identificación de los riesgos culturales, jurídicos, de reputación y técnicos asociados a conjuntos de datos específicos, socios y casos de uso de la IA
- Diligencia debida en las colaboraciones en materia de datos: evaluación de los posibles titulares de datos en cuanto a la procedencia, el historial de consentimientos, la autorización de la comunidad y la conformidad con los principios del IDS
- Barreras legales y de gobernanza: derechos de autor, propiedad intelectual comunitaria, control institucional y consideraciones sobre el tratamiento transfronterizo de datos
- Enfoques basados en datos mínimos viables: cómo crear herramientas de IA útiles sin esperar a disponer de conjuntos de datos perfectos
Diseño de la gobernanza y la rendición de cuentas
ObjetivoDiseñar modelos de gobernanza que incorporen la soberanía de los datos indígenas, definan quién controla qué modelos de IA se desarrollan y garanticen una colaboración fiable y a largo plazo.
Temas principales- La gobernanza de la IA como gobernanza indígena: ¿quién decide qué modelos se entrenan, con qué datos y con qué fines? ¿Y quién puede revocar el acceso?
- Modelos de gobernanza colectiva para bienes comunes de datos: estructuras, derechos de decisión y mecanismos de rendición de cuentas
- Funciones y responsabilidades de la gestión de datos a lo largo de todo el ciclo de vida de los datos
- Autoridad, legitimidad y control: modelos de acceso por niveles, derechos de veto de la comunidad y cláusulas de caducidad
- Integrar la gestión de riesgos en la gobernanza: traducir el registro de riesgos en políticas aplicables, derechos de auditoría y procesos de corrección
Arquitectura técnica y diseño de aplicaciones de IA
ObjetivoDiseñar la infraestructura técnica necesaria para crear, gestionar y poner en marcha los bienes comunes, así como para impulsar aplicaciones de inteligencia artificial de forma que las comunidades puedan controlarlas y mantenerlas.
Temas principales- Tipos de aplicaciones de IA para lenguas indígenas: reconocimiento de voz (ASR), síntesis de voz (TTS), traducción automática, ajuste de modelos de lenguaje grande (LLM) y generación aumentada por recuperación (RAG): requisitos técnicos e implicaciones para la comunidad en cada caso
- Opciones de arquitectura técnica: modelos centralizados, federados y locales, en consonancia con los principios de soberanía
- Controles de acceso a los datos que plasman las decisiones de gobernanza: licencias controladas por la comunidad, API de acceso por niveles y registros de auditoría
- Estándares interoperables, esquemas y vocabularios compartidos para datos en lenguas indígenas
- Herramientas y marcos de código abierto: qué hay disponible, qué carencias persisten y cómo desarrollar capacidades a nivel local
Sostenibilidad, financiación y puesta en práctica
ObjetivoCrear una vía viable y financiable hacia un funcionamiento a largo plazo, basada en la realidad institucional y no en una lógica de proyectos piloto a corto plazo.
Temas principales- Convertir la incubadora en una propuesta: lo que los financiadores necesitan ver (claridad del problema, legitimidad en la comunidad, viabilidad técnica, rigor en la gobernanza y sostenibilidad)
- Panorama de la financiación: modelos filantrópicos, del sector público, multilaterales (UNESCO, ONU) y de generación de ingresos para los bienes comunes de datos de la lengua y la cultura indígenas
- Modelos de sostenibilidad: acogida institucional, propiedad comunitaria e ingresos generados por aplicaciones de IA
- Incentivos y obstáculos institucionales: qué motiva a las universidades, los gobiernos y las empresas tecnológicas a participar, y qué les frena
- Ampliación y replicación: diseñar desde el principio para facilitar una mayor adopción en todas las comunidades lingüísticas
Crea tu propuesta subvencionable.
Este programa de seis meses abarca desde la definición de la oportunidad hasta la elaboración de una propuesta financiable y una hoja de ruta operativa. Presenta tu solicitud para que tu idea de bienes comunes de datos forme parte de la promoción.