Recurren a IA para mantener “vivas” lenguas originarias de México
La tecnología se ha convertido en una aliada inesperada para preservar el patrimonio lingüístico de México.

De acuerdo con información difundida en publicaciones de la Universidad Nacional Autónoma de México (UNAM), especialistas trabajan en el uso de inteligencia artificial para registrar y conservar las lenguas originarias del país en formato digital.
El proyecto se desarrolla en el Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS). Ahí, investigadores exploran cómo las herramientas de inteligencia artificial pueden ayudar a documentar idiomas que enfrentan una reducción constante en el número de hablantes. El investigador Iván Vladimir Meza Ruiz explicó que estas tecnologías permitirían mantener registros digitales de estas lenguas, incluso en casos donde su uso cotidiano disminuye.
Según datos compartidos por el especialista durante una sesión organizada por el Programa Universitario de Bioética de la UNAM, México cuenta con 68 lenguas nacionales agrupadas en 11 familias lingüísticas y más de 360 variantes. Sin embargo, varias atraviesan un proceso de pérdida de hablantes. En 1930, alrededor del 15 % de la población utilizaba alguna lengua originaria; para 2020, esa cifra se redujo a 6.2 %, y en muchos casos quienes las hablan son personas mayores.
El investigador señaló que uno de los principales retos para utilizar inteligencia artificial es la falta de datos. Para entrenar sistemas digitales se requieren grandes volúmenes de textos, audios y registros lingüísticos, algo que todavía es limitado en muchas lenguas indígenas. Como ejemplo, mencionó que en plataformas colaborativas apenas existen unos miles de artículos en idiomas como el náhuatl o el maya yucateco, y cantidades mucho menores en otras lenguas.
Otro obstáculo tiene que ver con los derechos de autor y el uso de materiales culturales. Meza Ruiz comentó que parte de los documentos, grabaciones o textos disponibles pertenecen a comunidades o autores específicos, lo que abre un debate sobre cómo compartir esa información respetando la propiedad intelectual y los derechos culturales.
Además, muchas de estas lenguas tienen una tradición principalmente oral. Esto significa que existen menos registros escritos y más dificultades para crear bases de datos digitales. Incluso, señaló el investigador, buena parte del material disponible se concentra en canciones o piezas musicales, mientras que las grabaciones del habla cotidiana son escasas.
Aun así, especialistas consideran que desarrollar herramientas digitales podría abrir nuevas posibilidades para las comunidades hablantes. Sistemas basados en inteligencia artificial podrían facilitar el acceso a servicios como educación, salud o justicia en lengua materna, además de crear espacios de lectura, conversación y aprendizaje.
El siguiente paso, según los investigadores de la UNAM, consiste en construir un ecosistema que permita recopilar más datos lingüísticos, con la participación de las propias comunidades. La meta es sencilla en el papel pero compleja en la práctica: registrar, digitalizar y preservar la diversidad lingüística de México para las próximas generaciones.






