UNAM le apuesta a la IA para rescatar lenguas indígenas en México

2026-03-15 21:24:46 - MUNDO

CIUDAD DE MÉXICO, marzo 15 (EL UNIVERSAL).- La Universidad Nacional Autónoma de México (UNAM) le apuesta a la Inteligencia Artificial para preservar y contar con un registro digital de las 68 lenguas indígenas en México, ante el riesgo de extinción que afrontan.

En un boletín, la Máxima Casa de Estudios explicó que especialistas del Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas desarrollan una herramienta que busca mantener "vivas" las lenguas, aunque sea de manera artificial.

En el país hay 68 lenguas nacionales, 11 familias y 364 variantes lingüísticas, en donde muchas están cayendo en desuso y se dirigen a la extinción, alertó Iván Vladimir Meza Ruiz, investigador de esta entidad universitaria.

Según el especialista, en el año 1930 había un 15% de hablantes de lenguas indígenas en México, cifra que en 2020 disminuyó a apenas 6.2%; además, quienes las utilizan son principalmente personas mayores, mientras que generaciones más jóvenes "casi no las practican".

Meza Ruiz indicó que tecnológicamente se cuenta con el conocimiento necesario para crear versiones paralelas de forma masiva y digital de estas lenguas, pero dependen de "reunir suficiente información".

De acuerdo con el especialista, se carece de datos masivos de las lenguas originarias en México, por la poca cantidad de artículos que existen en cada una de ellas: en náhuatl clásico, 4 mil 272 publicaciones; en maya yucateco, mil 201; náhuatl central, 224; mixteco, 113; hñahñu, 90; purépecha, 12 y mixe del norte, 10.

De acuerdo con el académico, con este uso de IA enfrentan un dilema ético, debido a que numerosas obras y documentos en estas lenguas están sujetas a autoría, por lo que tienen derechos morales y patrimoniales.

Sin embargo, aseguró que la estrategia digital podría ayudar a las comunidades hablantes a tener acceso a derechos como salud, justicia, educación, autonomía económica, así como una lectura y plática en sus lenguas.

Otra dificultad, expuso, es que en México varias de estas lenguas son orales y, por ello, existen menos registros, lo que produce una problemática de dato biométrico.

"Los datos existentes están sesgados hacia la música y hay escasos registros del habla, la cual es además un punto de contacto para la discriminación", dijo.

En ese sentido, consideró que las lenguas originarias en México no están bien representadas en términos de datos lingüísticos; por ello, la UNAM va por crear un ecosistema para recolectar estos datos y conservarlas, aunque sea digitalmente.

Fuente: google.com