Preguntas frecuentes.
Información sobre bienes comunes de datos (data commons), la incubadora New Commons y el enfoque actual en las lenguas y culturas indígenas. ¿Sigues sin saber cómo hacerlo? Envía un correo electrónico al equipo.
Antecedentes
Qué son los bienes comunes de datos, los problemas que pretenden resolver y ejemplos de iniciativas existentes.
Los bienes comunes de datos son ecosistemas de datos gestionados de forma colaborativa, diseñados para reunir y proporcionar un acceso responsable (y regulado) a conjuntos de datos diversos y de alta calidad, procedentes de uno o varios sectores, con el fin de permitir el desarrollo y la implementación de aplicaciones de IA generativa que aborden retos de interés público.
Este enfoque se distingue por tratar los datos como un recurso compartido gobernado por una comunidad, en lugar de controlarlos únicamente como propiedad individual o institucional. Además, reconoce que los datos abiertos, abiertos por defecto y a menudo totalmente públicos, no ofrecen por sí solos una solución completa. En un panorama de datos en constante evolución, garantizar que la apertura respalde los objetivos de interés público requiere abordar cómo fluyen el reconocimiento y los beneficios, especialmente cuando los datos disponibles públicamente pueden reutilizarse ampliamente sin que ello reporte un beneficio claro a las comunidades que los gestionan. Pueden apoyar, por ejemplo, el desarrollo responsable de la IA, la adaptación al cambio climático y la conservación de la biodiversidad, la salud pública y la preparación ante pandemias, la agricultura sostenible, la investigación científica, la respuesta ante desastres, y la preservación, revitalización y gestión responsable de los conocimientos indígenas, las lenguas, el patrimonio cultural y las economías de datos.
Se puede encontrar más información sobre bienes comunes de datos aquí.
Los bienes comunes de datos tienen como objetivo abordar varias deficiencias estructurales:
- Asimetrías de acceso: Muchas grandes organizaciones pretenden utilizar los datos abiertos para extraer valor de los demás, al tiempo que limitan el acceso a sus propios datos privados. Los bienes comunes de datos pueden introducir mecanismos a través de los cuales las comunidades puedan influir en quién accede a sus datos, cómo y con qué finalidad.
- Fallos de coordinación: A menudo existen altos costes de transacción para compartir datos con un solo actor o de forma puntual (por ejemplo, la formulación de acuerdos y normas de intercambio de datos a medida). Los bienes comunes de datos pueden crear procesos más estandarizados para compartir datos bajo normas coherentes.
- Déficit de confianza: En muchos acuerdos de intercambio de datos, los intereses y las expectativas del público o de las comunidades que aportan datos no se incorporan de manera significativa. Esto erosiona la licencia social y limita la legitimidad de cualquier (re)utilización de datos. Los bienes comunes de datos intentan centrar estas preocupaciones a través de la gobernanza, la supervisión y las condiciones de acceso.
- Infrautilización: Un problema que afecta a la reutilización de datos es que los conjuntos de datos más valiosos no se utilizan para el bien público, sino que se restringen. Los bienes comunes de datos pueden ampliar el acceso a un conjunto más amplio de actores, siempre que se comprometan a respetar las normas establecidas por los organizadores.
De esta manera, los bienes comunes de datos pueden apuntar hacia relaciones de intercambio de datos más sostenibles y equitativas para el bien público. Pueden abordar algunas de las preocupaciones que alimentan la escasez de datos y el actual «invierno de los datos». Pueden reorientar el debate sobre la IA para centrarse en la IA de interés público y la toma de decisiones.
Nuestra investigación revela que los acuerdos de bienes comunes de datos suelen presentar una serie de características comúnmente implementadas que reflejan el estado actual del sector:
- Finalidad pública: Tiene como objetivo proporcionar los datos necesarios para resolver problemas públicos y desarrollar IA de interés público.
- Gobernanza participativa: Cuenta con una estructura de gobernanza que ofrece vías significativas para que los miembros de los bienes comunes ejerzan su capacidad de decisión sobre cómo se utilizan sus datos.
- Mecanismos de rendición de cuentas: Supervisa de forma continua la aplicación de las normas del bien común. Cuenta con sistemas para gestionar los conflictos y exigir responsabilidades a quienes no cumplan las normas.
- Beneficios para los colaboradores: Ofrece beneficios claros a las partes interesadas que han contribuido a los bienes comunes. Esto puede incluir beneficios económicos, acceso anticipado a herramientas de IA o a investigaciones desarrolladas, reconocimiento de autoría, información para o sobre ellos, afiliación gratuita, acceso a infraestructura para desarrollar nuevas herramientas de IA, etc.
- Controles de acceso: Incluye normas claramente definidas que regulan cómo, cuándo y quién puede acceder a los conjuntos de datos y utilizarlos. Esto puede implicar marcos estandarizados, como las licencias Creative Commons, así como modelos de acceso por niveles, restringidos o basados en el consentimiento.
- Financiación y apoyo: El bien común de datos suele financiarse como un bien público, a menudo con el apoyo del gobierno, de entidades filantrópicas o mediante un modelo de afiliación o cooperativo.
Los bienes comunes de datos constituyen una práctica emergente. Son relativamente pocas las iniciativas existentes que se ajustan plenamente a la definición de sistemas gestionados de forma colaborativa en los que las comunidades ejercen autoridad sobre los datos. En cambio, los ejemplos actuales abarcan un amplio espectro de modelos que incorporan algunas características propias de los bienes comunes, como el acceso compartido, la participación de múltiples partes interesadas o la orientación hacia el interés público, sin que siempre se aplique una gobernanza colectiva. Las iniciativas que se indican a continuación ilustran esta variedad:
- CLARIN: CLARIN proporciona la infraestructura para combinar datos lingüísticos de instituciones de toda Europa con fines de investigación. La gobernanza es multilateral a nivel institucional, pero la autoridad para la toma de decisiones la ejercen los Estados miembros y las organizaciones, en lugar de una comunidad de colaboradores más amplia.
- Common Voice: Common Voice es un conjunto de datos de voz abierto y de colaboración colectiva que puede utilizarse para entrenar aplicaciones de voz basadas en IA. La iniciativa tiene como objetivo ampliar el acceso a los datos de voz para idiomas distintos del inglés y otros grupos que suelen estar infrarrepresentados en los conjuntos de datos de voz. La iniciativa está liderada por la Fundación Mozilla.
- Language Data Commons of Australia: El proyecto «Language Data Commons of Australia» es una colaboración entre el Australian Research Data Commons y la Facultad de Lenguas y Culturas de la Universidad de Queensland que busca poner a disposición datos lingüísticos australianos para «usos tanto académicos como no académicos».
- Querido Diário: Open Knowledge Brasil pretende desarrollar un bien común de datos para los boletines oficiales municipales. Su plataforma Querido Diário tiene como objetivo facilitar el acceso a estos conjuntos de datos y ayudar a analizar la información que contienen. Su objetivo es mejorar la toma de decisiones a nivel local en Brasil.
- Malawi Voice Data Commons: Malawi Voice Data Commons, del Programa de Investigación y Educación para la Paz de la Universidad de Nueva York (NYU), desarrollado en colaboración con Ushahidi, el PNUD y la Fundación Mozilla, permite a los habitantes de las zonas rurales de Malaui informar de emergencias en sus lenguas nativas, creando conjuntos de datos multilingües y preparados para la inteligencia artificial con fines de respuesta humanitaria y preservación lingüística. La fase piloto se llevará a cabo en Malaui, con planes de ampliarla a toda el África subsahariana.
Acerca de la incubadora
En qué consiste la incubadora, qué obtienen los participantes, plazos, requisitos de participación y evaluación.
La incubadora New Commons es un programa estructurado destinado a ayudar a personas y equipos a desarrollar propuestas detalladas y viables para la creación de bienes comunes de datos en la era de la IA.
Aborda una cuestión fundamental: la capacidad limitada de las comunidades para influir en cómo se utilizan sus datos o para beneficiarse de forma significativa de ese uso. Mediante la creación y mejora de bienes comunes de datos, que son ecosistemas de datos gobernados de forma colaborativa que agrupan y proporcionan un acceso responsable a conjuntos de datos diversos y de alta calidad, se puede colmar la brecha en el desarrollo de la IA.
A través de este programa, te unirás a un grupo de compañeros para participar en diversas actividades de aprendizaje entre pares, oportunidades de networking y formación impartida por expertos de renombre internacional. Aunque la Incubadora no ofrece respaldo financiero directo, trabajaremos para transformar tu idea de un bien común de datos en un concepto (y una propuesta) viable que pueda presentarse a financiadores capaces de escalarla.
A través del programa de la incubadora, los participantes podrán:
- Establecer contacto con un grupo internacional de custodios de datos;
- Establecer contactos con financiadores y presentarles su trabajo;
- Trabajar con expertos para desarrollar un plan sólido para establecer un bien común de datos;
- Asistir a sesiones de formación relevantes sobre diversos temas, como el diseño de marcos de gobernanza, la creación de licencias sociales y la construcción de conjuntos de datos preparados para la IA; y
- Someter sus propuestas a la revisión de expertos del sector y compañeros.
Los participantes no recibirán financiación directamente de Microsoft, la UNESCO o The GovLab, aunque nos esforzaremos por poner en contacto a los participantes con posibles financiadores al final del programa. La Incubadora no proporcionará infraestructura informática ni suministrará datos para el bien común de datos propuesto.
No solicitaremos ningún dato a los participantes y todos los datos y materiales seguirán siendo propiedad exclusiva de los solicitantes.
- Plazo de inscripción abierto: 19 junio 2026
- Cierre de solicitudes: 14 ago 2026 a las 23:59 ET
- Selección de participantes: Finales de agosto de 2026
- Inicio: Mediados de septiembre de 2026
- Programación virtual: Octubre 2026 – abril 2027
- Exposición: Abril 2027
Los participantes en la Incubadora de lenguas y culturas indígenas deben ser indígenas o tener una relación reconocida con comunidades indígenas. A través del proceso de solicitud, nos esforzaremos por garantizar que los solicitantes cuenten con los recursos necesarios para establecer un bien común de datos que pueda proteger de manera significativa los intereses de su comunidad y asegurar que los beneficios se distribuyan de forma equitativa.
Todas las propuestas deben cumplir los requisitos mínimos. Las candidaturas que cumplan dichos requisitos mínimos serán evaluadas por un grupo de jueces expertos (seleccionados por el Comité Directivo o aprobados por este). Se pedirá a los jueces que evalúen las propuestas basándose en una rúbrica que examine criterios específicos. Las preguntas de la columna de la izquierda se incluirán en el formulario de solicitud para comunicar lo que los jueces buscan específicamente en cada categoría.
Cada propuesta será evaluada por tres jueces. Se calculará la media de las puntuaciones y las propuestas con mayor puntuación se compartirán con el comité directivo colectivo. Buscaremos la equidad y procuraremos que todas las propuestas sean evaluadas por el mismo número de miembros del jurado. En caso de que no todos los jueces presenten puntuaciones y algunas solicitudes se queden con dos evaluaciones en lugar de tres, eliminaremos la puntuación más baja de cualquier propuesta que haya sido evaluada por tres jueces antes de calcular la media.
En colaboración con el Comité Directivo, los organizadores de la Incubadora llevarán a cabo una diligencia debida de los solicitantes con las puntuaciones más altas para garantizar que cada uno de ellos tenga una relación sólida con la comunidad indígena a la que pretenden servir. El equipo del proyecto se asegurará de que las propuestas sean revisadas por expertos de la región en cuestión que puedan evaluar adecuadamente si la relación es sólida.
Salvo que se den circunstancias atenuantes (por ejemplo, la imposibilidad de confirmar el apoyo de la comunidad o sus propias credenciales), se invitará a los equipos a unirse a la cohorte. Si algún participante se retira, se invitará en su lugar al participante con la siguiente puntuación más alta.
Normas y estándares
Normas éticas, el papel de cada actor, principios fundamentales para la toma de decisiones y alcance global.
Para los participantes:
Todos los participantes deben ajustar sus propuestas de bienes comunes de datos a los principios de soberanía de los datos indígenas. Si un participante se niega a ajustar su trabajo a los principios de soberanía de datos indígenas, se le pedirá inmediatamente que abandone el programa. Esto incluye, entre otros:
- Incluir datos no autorizados en los bienes comunes;
- Activar los bienes comunes sin la necesaria licencia social para operar;
- No reconocer las leyes indígenas, las obligaciones de los tratados y otras normas; y
- Proponer el acceso a los datos en un formato que no se ajuste a la gobernanza indígena.
Para ayudar a mitigar este riesgo, en la revisión de las solicitudes pediremos al jurado que compruebe si el proyecto se ajusta a los principios de soberanía de datos indígenas. Presentaremos estas normas al Comité Directivo. Modificaremos este protocolo si identifican que faltan principios u obligaciones fundamentales.
Para el equipo del proyecto:
El equipo del proyecto se adhiere a los Principios CARE para la gobernanza de los datos indígenas. Esto significa que, en todo momento, actuará para garantizar:
- Beneficio colectivo: El equipo tratará de diseñar la Incubadora de manera que se garantice que los pueblos indígenas puedan obtener beneficios de los datos. Guiado por el comité directivo, seleccionará propuestas que demuestren una preocupación por resultados justos y equitativos, una mejor gobernanza y la participación ciudadana. Los materiales de formación de la Incubadora promoverán resultados similares.
- Autoridad de control: La Incubadora reconoce los derechos e intereses de los pueblos indígenas en relación con los datos indígenas y busca empoderarlos para que controlen sus propios datos. Reconociendo estos derechos e intereses, los miembros del equipo del proyecto nunca solicitarán datos a los participantes ni les obligarán a utilizar sistemas específicos. El modelo de bienes comunes de datos pretende ofrecer una alternativa a los marcos de datos abiertos existentes al abordar las asimetrías de acceso, permitiendo que sean los propios participantes indígenas quienes decidan a quién quieren facilitar sus datos, en qué condiciones y con qué finalidad.
- Responsabilidad: El equipo del proyecto Incubator reconoce que tiene la responsabilidad de comunicar cómo apoyará la autodeterminación y el beneficio colectivo de los pueblos indígenas. Buscamos fomentar relaciones positivas estableciéndonos límites específicos y utilizando esta iniciativa de desarrollo de capacidades para apoyar la formación de una fuerza de trabajo indígena especializada en datos que pueda controlar sus propios datos. Nos comprometemos a trabajar con el Comité Directivo Indígena y con los equipos participantes individuales para garantizar que todo el apoyo que ofrecemos se base en la cosmovisión, las experiencias vividas, los valores y los principios de los pueblos indígenas.
- Ética: Aunque la Incubadora no trabajará directamente con datos, uno de nuestros objetivos principales es promover el uso ético de los datos en todas las etapas de su ciclo de vida y en todo el ecosistema de datos. Trabajaremos con nuestro Comité Directivo para abordar los desequilibrios de poder y utilizaremos nuestra presentación final para intentar abordar los desequilibrios de recursos. Cualquier material que utilicemos y que se base en conocimientos tradicionales hará uso de Etiquetas de Conocimientos Tradicionales. Toda la formación reconocerá y hará hincapié de forma proactiva en los derechos de todos los pueblos indígenas, sus culturas y sus conocimientos. Todo nuestro trabajo se ajustará a la Declaración de las Naciones Unidas sobre los Derechos de los Pueblos Indígenas.
En la sección siguiente se pueden encontrar detalles sobre cómo se distribuirán las funciones y responsabilidades entre cada una de las organizaciones que patrocinan esta Incubadora.
El Comité Directivo
El Comité Directivo es un grupo de expertos indígenas y representantes de la comunidad a los que se ha invitado a impulsar todas las actividades de la Incubadora. Si bien el equipo del proyecto (The GovLab, la UNESCO y Microsoft) propone enfoques, recurrimos al Comité Directivo para diseñar conjuntamente este trabajo, garantizando que se mantenga alineado con las prioridades de la comunidad, el contexto cultural y los estándares éticos. Este trabajo puede incluir:
- Orientación estratégica y desarrollo de modelos: Contribuir a la incubación de modelos replicables que se basen en las limitaciones del mundo real y puedan adaptarse a distintos contextos.
- Revisar y validar los materiales básicos: Aportar comentarios sobre los borradores de los materiales de la Incubadora para garantizar la alineación con las prioridades de la comunidad, la sensibilidad hacia las dinámicas culturales y regionales, y el cumplimiento de sólidos estándares éticos.
- Evaluación contextual y selección: Participar en la revisión de las propuestas presentadas, ayudando a garantizar que estas se evalúen con un conocimiento fundamentado de los retos y oportunidades locales.
- Configuración de la participación y la visibilidad: Ayudar a definir cómo deben participar tanto ellos como otros, y cómo deben reconocerse públicamente sus contribuciones, de formas que sean significativas y adecuadas.
Equipo del proyecto
Los socios del proyecto —The GovLab de la NYU, la UNESCO y Microsoft— actúan como principales facilitadores de este trabajo, reuniendo recursos, conocimientos y experiencia bajo la orientación del comité directivo. Aprovechando su experiencia única, los miembros del equipo del proyecto participarán en lo siguiente:
The GovLab: Basándose en una década de experiencia en el diseño y la gestión de colaboraciones de datos innovadoras y responsables, así como en la creación de un grupo de administradores de datos, The GovLab liderará todos los esfuerzos para desarrollar la formación, identificar recursos y contratar a profesores invitados relevantes. Ofrecerá apoyo directo a los equipos a la hora de diseñar programas, decidir los marcos de gobernanza y evaluación, y buscar financiación. Prestará especial atención al diseño de materiales que sean pertinentes y respetuosos con las comunidades indígenas y sus conocimientos tradicionales. Utilizaremos Etiquetas TK y nos aseguraremos de que todas las actividades de la Incubadora se ajusten a los Principios CARE (tal y como se describen en la sección 7).
UNESCO: La UNESCO aporta legitimidad multilateral, capacidad de convocatoria y un mandato normativo único como organismo líder de las Naciones Unidas en materia de multilingüismo, cultura, ciencia abierta, gobernanza de datos y ética de la IA. La Incubadora se integrará en el Sector de Políticas Digitales y Transformación Digital de la UNESCO y en su Iniciativa sobre la Gobernanza de los Datos en la Era Digital, que promueven la libertad de expresión, el desarrollo de los medios de comunicación, la alfabetización mediática e informacional, el acceso universal a la información y la preservación del patrimonio documental, al tiempo que fomentan enfoques de la transformación digital centrados en las personas y basados en los derechos.
Como organismo rector de las Naciones Unidas para el Decenio Internacional de las Lenguas Indígenas (IDIL 2022-2032), la UNESCO coordina los esfuerzos mundiales para salvaguardar, revitalizar y promover las lenguas indígenas y los sistemas de conocimiento relacionados. Aprovechando las relaciones de larga data con las comunidades indígenas, los Estados Miembros de las Naciones Unidas y las instituciones culturales y de memoria, la UNESCO pondrá en contacto a los equipos de la Incubadora con los socios pertinentes, proporcionará orientación estratégica y apoyará la divulgación comunitaria basada en la cultura. También se asegurará de que la labor de la Incubadora esté en consonancia con las iniciativas más amplias de las Naciones Unidas en materia de inclusión digital y relacionadas con los idiomas, incluida la IDIL y sus planes de acción asociados, y contribuya a ellas.
Microsoft: Microsoft es una empresa tecnológica global con experiencia en el apoyo a iniciativas de datos de interés público y a esfuerzos responsables en materia de IA. La participación de Microsoft en la Incubadora estará dirigida por el equipo de Innovación Abierta, que se centra en impulsar los datos abiertos y los bienes comunes de datos y promover datos accesibles y reutilizables para abordar los retos sociales.
Microsoft aportará su experiencia cuando se le solicite, por ejemplo, revisando propuestas, ofreciendo orientación sobre la gobernanza de datos, la preparación para la IA, la reutilización responsable de datos, consideraciones de diseño técnico y posibles requisitos de infraestructura. El objetivo de este apoyo es ayudar a los participantes a comprender las opciones y los planes para la implementación futura, más que operar, alojar, construir o dotar de recursos al bien común de datos en sí mismo.
El equipo del proyecto no actuará como representante de las comunidades indígenas. Trabajará con el Comité Directivo para tomar medidas preventivas activas que garanticen que todo el trabajo siga siendo propiedad de los equipos individuales y que estos, así como las comunidades a las que representan, mantengan plena autonomía y control sobre su información.
Aunque este proyecto busca desarrollar habilidades y no bienes comunes de datos directamente, nunca solicitaremos datos. Operaremos con estricta confidencialidad en todas las fases de esta Incubadora. No permitiremos el acceso a ninguna propuesta de los participantes ni a los activos de datos de la comunidad, salvo con el fin de apoyar directamente el programa. El equipo del proyecto no accederá, conservará ni utilizará ningún dato de la comunidad ni contenido de las propuestas con fines comerciales durante el programa ni después de este. Todas las propuestas y documentos relacionados de los solicitantes y participantes se destruirán tras la presentación del informe final.
Desde el punto de vista institucional, cada una de las organizaciones que integran el equipo del proyecto reconoce y defiende los valores de la diversidad, la transparencia, la rendición de cuentas y la promoción de la equidad. Buscamos centrarnos en el bien público, lo que incluye empoderar a los grupos desfavorecidos y fomentar la inclusión y la igualdad de oportunidades.
Para esta Incubadora, priorizamos dos principios organizativos a la hora de tomar decisiones importantes sobre la misma:
- Beneficios compartidos: Este trabajo debe utilizarse para ayudar a las comunidades indígenas a aprovechar mejor los datos que poseen en su propio beneficio. Buscamos asegurarnos de no agravar las asimetrías de poder y seremos conscientes del contexto moral, político, legal y económico específico para garantizar que los beneficios se distribuyan de manera equitativa.
- Impulsado por los indígenas: El equipo del proyecto reconoce la necesidad de que los pueblos indígenas tomen decisiones sobre sus propias comunidades y sus propios datos. Estableceremos los requisitos de solicitud y colaboraremos con el comité directivo para garantizar que los equipos del proyecto puedan hablar en nombre de las comunidades a las que dicen representar. Recurriremos al comité directivo para que nos oriente sobre todos los recursos y el plan de formación, con el fin de garantizar que el trabajo sea útil, pertinente e incorpore los conocimientos y las orientaciones ya desarrolladas y adoptadas por las comunidades indígenas en otros contextos (por ejemplo, los Principios CARE, Etiquetas de Conocimiento Tradicional).
Esta incubadora no puede abarcar ni representar todas las lenguas, sobre todo teniendo en cuenta que en todo el mundo se hablan miles de ellas. En su lugar, mantendremos esta incubadora abierta a cualquier comunidad indígena e incluiremos a quienes estén interesados en participar y cumplan nuestros criterios de selección.
Una vez que hayamos reunido al grupo definitivo, trabajaremos para garantizar que los materiales sean útiles y relevantes para los seleccionados.