Tecnología

Microsoft logró que su generador de voz con IA hable como humano: Es tan peligroso que han tomado esta medida

La inteligencia artificial de Microsoft ya produce voces que alcanzan la paridad humana. Esto lo podría convertir en una herramienta peligrosa, por lo que la compañía tomó una firme decisión sobre su uso.

La IA de Microsoft ya puede emular la voz humana a la perfección. Foto: Interesting Engineering
La IA de Microsoft ya puede emular la voz humana a la perfección. Foto: Interesting Engineering

La inteligencia artificial (IA) es una de las tecnologías que más atención ha logrado capturar en el mundo. Su uso abarca una gran cantidad de áreas, pudiendo generar imágenes o textos, componer piezas musicales, lograr que imágenes estáticas adquieran movimiento, entre muchas otras cosas. Por ello, distintas compañías tecnológicas están buscando profundizar en las capacidades que ofrece la IA.

Microsoft es una de las compañías que está enfocándose en el desarrollo de esta nueva tecnología para crear nuevas herramientas. Recientemente dieron a conocer que VALL-E 2, su generador de voz que funciona con inteligencia artificial, ha logrado generar voces que han alcanzado la paridad humana. Debido a las distintas implicaciones éticas que esto puede provocar en la sociedad, la compañía ha tomado una firme decisión acerca de su disponibilidad para el público. ¿Quieres saber cuál es? Aquí te lo explicamos.

¿Qué es VALL-E?

VALL-E es una inteligencia artificial generativa (IAG) de Microsoft que fue anunciada en enero del 2023. Esta tecnología puede clonar la voz humana a partir de un simple audio de 3 segundos. Para ello, la compañía ha entrenado a esta IA con LibriLight, la biblioteca de audios de Meta.

Recientemente se ha estrenado VALL-E 2, la última versión de esta IAG que ha alcanzado la paridad humana. Esto quiere decir que ya puede producir un habla natural como si fuera completamente real. Para poder certificar este logro, esta tecnología tuvo que pasar por varias pruebas, las cuales superó satisfactoriamente.

Si tienes interés en escuchar cómo suenan las voces generadas por esta inteligencia artificial generativa, Microsoft ha puesto a disposición del público algunos extractos de audio en esta página web.

Microsoft reconoce los peligros de VALL-E 2

Desde cierta perspectiva, para Microsoft esto representa una gran ventaja porque puede ser usado en la educación, el entretenimiento, herramientas de accesibilidad, traducción, periodismo, entre otros. Sin embargo, la propia compañía también reconoce que ciertas personas pueden utilizarlo con fines maliciosos, como la suplantación de identidad.

Tomando en cuenta estas dos posibilidades, Microsoft ha decidido no implementarlo en algún producto de consumo o lanzar esta nueva tecnología para el público en general, debido al gran peligro que representa. Por ello, la empresa tecnológica resaltó que VALL-E 2 se mantendrá enteramente como un proyecto de investigación.

Ya existen estafas que utilizan voces clonadas

Si bien Microsoft no va a lanzar la tecnología VALL-E 2 al público, existen otras inteligencias artificiales que también clonan voces, pero que no tienen la precisión exacta de la compañía tecnológica. A pesar de ello, ya hay ciberdelincuentes que están utilizando una IA menos avanzada para estafar a las personas con voces clonadas.

Ya se reportó en España un caso en el que una mujer recibió una llamada de su supuesto esposo, quien le pidió que le escribiera a un número desconocido. Sin embargo, la persona que escuchó al otro lado de la línea no era su marido, sino alguien que clonó su voz a partir del uso de la inteligencia artificial.

Por ello, es importante que las personas conozcan sobre la existencia de estos avances de la inteligencia artificial generativa para que puedan prevenir posibles delitos o estafas que se apoyan en esta herramienta tecnológica.