El quechua se globaliza
Google ha lanzado un traductor para el quechua, una lengua que hablan más de 10 millones de personas -en sus diversas variantes- en Perú y otros países. Hablamos con dos especialistas peruanos que participaron del proyecto y con una escritora y activista digital sobre los alcances de esta herramienta.
Qillqayta qallarichkani (Estoy empezando a escribir). Ahora cualquier usuario del traductor de Google puede usarlo para traducir una frase de su idioma al quechua, o al revés, poner la frase en quechua y saber lo que significa en su idioma. Esta novísima herramienta, que a partir de ahora estará en permanente mejora, pone nuestro idioma ancestral al alcance de los que quieran conocerlo en cualquier parte del mundo.
“Es un buen trabajo en mi opinión. Y es un trabajo que los quechuahablantes deberíamos respaldar porque está en una plataforma como Google, dándonos a conocer a nivel mundial. Hay cosas que deben mejorar como en todo idioma. Como los traductores de otros idiomas, no traduce exacto. Pero ya es un logro”, comenta Marisol Necochea, profesora de quechua en la Universidad de Stanford e impulsora del grupo Cafecito Quechua, difusores de esta lengua y de la cultura andina.
Sudar Pichay, CEO de Google, en el lanzamiento del traductor. Foto: difusión.
Marisol Necochea, de la Universidad de Stanford, revisó los contenidos finales. Foto: cortesía.
A ella la contactaron cuando ya el traductor casi había completado sus contenidos en quechua. Necochea, natural de Sañayca, Apurímac, se encargó de revisar los resultados que arrojaba el traductor para afinar la escritura, comparó textos escritos con los resultados que arrojaba la máquina y planteó algunos cambios. “Había sufijos que no estaban bien ubicados. Los sufijos los separas y te puede dar una traducción diferente”, precisa. También habló con otros colegas y a la mayoría les pareció un buen trabajo.
Google trabajó en este proyecto desde hace por lo menos tres años. ¿Cómo logró cargar la data necesaria para que su traductor logre resultados satisfactorios? Usó toda la información en quechua que existe en la red, pero además replicó en su sistema todo lo aprendido por esta herramienta en la traducción de idiomas mayores y más extendidos en el mundo como el español, el inglés, el francés y otros.
En estos idiomas existen miles de libros en la lengua original y en traducciones, y el traductor de Google puede comparar y ver equivalencias para la misma frase. En el quechua, en cambio hay una cantidad menor de textos traducidos paralelamente en quechua-español y no son suficientes para que esta herramienta trabaje como lo hace con los idiomas más extendidos. Pero lo han conseguido satisfactoriamente.
“Lo interesante del proyecto es que el traductor se ha creado sobre la base de un sistema de aprendizaje automático. Lo que hace es, a partir de una cantidad grande de datos, deducir cuáles son las reglas, las posibilidades de que algo signifique lo que debe significar. Han tomado lo que ellos ya saben sobre otras lenguas del mundo. A eso lo llamamos un aprendizaje con recursos cero. Es decir, tú no tienes recursos para aprender, te voy a dar diferentes lenguas, y sobre esa base tú vas a deducir lo que dice aquí”, explica Carlos Molina Vital, lingüista de la Universidad de Illinois y quechuahablante.
El traductor en quechua, lanzado junto a otras 23 lenguas el 11 de mayo pasado, está basado en el quechua sureño. Carlos Molina señala que dadas las distintas variantes de quechua que hay en el país, el traductor actual debería quedar como “Quechua (sureño)”. Así se lo comentó al responsable del proyecto, Isaac Caswell, cuando le consultaron sobre la herramienta. Y quizá a futuro debería haber traductores propios para el quechua central o el ancashino porque el actual no engloba a todos.
PUEDES VER: Las crónicas quechua
“El quechua de Junín no se entiende con el del Cusco. Parece que dos personas se entienden porque cuando no saben una palabra se van al español, pero si hablaran solo quechua no podrían conversar”, dice.
Lo que sigue ahora es la contribución de las personas quechuahablantes. El traductor te da opciones para revisar oraciones y frases y precisar si están bien o no se ajustan a la traducción. También se puede contribuir con palabras y frases que se acerquen más a la definición que se busca. Como pasa con todos los traductores, es un proceso de permanente mejora. Por ejemplo, para “Tupananchiskama” la opción te da “adiós”. Pero también podría ser “Hasta luego” que -según Molina- es más preciso.
Traductor aún limitado
Para la escritora y activista digital Irma Álvarez Ccoscco, esta herramienta todavía no tiene la funcionalidad que debería tener y lo ve todavía como un test porque -según ha comprobado como usuaria- puede traducir bien una palabra pero cuando pones esa palabra en una oración a veces puede traducir extrañamente.
También llama la atención acerca de que Google podría o debería trabajar a futuro en tecnología de reconocimiento de voz. “Hoy Google reconoce voz en español e inglés, pero no en quechua. Eso requiere un trabajo. Si mi mamá me habla en quechua en el teléfono, debería tener la posibilidad de tener el texto en traducción. Y yo, por ejemplo, le puedo pasar eso a mi hermanita menor que no sabe quechua y ella podría entender a mi mamá. O por ejemplo, si alguien habla en quechua y hay traducción de voz, podría expresarse con valía frente a un juez. Eso aún no se puede hacer”, dice.
En ese sentido señala que hay esfuerzos de investigadores independientes para desarrollar esta tecnología. Cuenta que en el Cusco se ha trabajado en un reconocedor de voz que ya ha sido probado, pero faltan recursos para impulsar ese proyecto. También explica que en Zurich, la investigadora peruana Annette Ríos ha desarrollado un analizador morfológico del quechua. “Debemos generar herramientas con datos abiertos para que la gente colabore y esa data sea accesible a la comunidad”, dice.
Google, a través del responsable del proyecto, Isaac Caswell, reconoce que -igual que con los demás idiomas lanzados- todavía están en una etapa incipiente. “La calidad de las traducciones producidas por estos modelos todavía está muy por detrás de la de los idiomas de mayores recursos [...] Son sin duda una primera herramienta útil para comprender el contenido en idiomas de escasos recursos, pero cometerán errores”, precisa Caswell. Sin embargo, el traductor será muy útil a medida que los propios quechuahablantes, como ya está ocurriendo, vayan afinando sus contenidos.