Tecnología

VALL-E: ¿cómo funciona la inteligencia artificial que imita cualquier voz con solo oírla?

VALL-E solo necesita captar 3 segundos de tu voz para replicarla. Miles temen que esta IA pueda ser utilizada para suplantar la identidad de las personas.

Esta IA ha generado mucha controversia en la internet. Foto: Hipertextual
Esta IA ha generado mucha controversia en la internet. Foto: Hipertextual

Durante el 2022, se dieron a conocer varias inteligencias artificiales. Una de las más populares, considerada como el terror de los diseñadores gráficos, fue DALL-E. Si nunca has escuchado hablar de ella, debes saber que esta IA puede crear cualquier imagen de algo que hayas escrito. Por ejemplo, si le pides que elabore una foto de un gato con metralleta caminando por la playa, este software te lo cumplirá.

Además de DALL-E, en 2022 hubo otra inteligencia artificial que dio que hablar en las redes sociales. Nos referimos a ChatGPT, un bot creado para dar respuestas a cualquier interrogante que se te ocurra. Su popularidad se incrementó de forma exponencial porque muchos cibernautas comenzaron a utilizarlo para hacer resúmenes de libros, ensayos, cartas, etc.

Ahora llegó VALL-E

El 2023 parece que también será el año de las inteligencias artificiales, ya que Microsoft (la compañía de Bill Gates) y OpenAI (creadores de ChatGPT y DALL-E) se encuentran trabajando en VALL-E, una IA que puede imitar la voz de cualquier ser humano con solo oírla durante tres segundos.

Según detalla AndroidPhoria, un portal especializado en tecnología, VALL-E comenzó como un software que permite generar un audio a partir de texto, algo que no es muy novedoso. Sin embargo, ahora puede analizar la voz de una persona para replicarla, incluso es capaz de imitar el tono, estilo y entonación de manera muy precisa.

De acuerdo a la publicación, los creadores de VALL-E han generado más de 6.000 horas de contenido, en las que se ha podido imitar a la perfección a más de 7.000 personas que hablaban de diferentes formas.

Por el momento, VALL-E no ha sido liberado al público, ya que Microsoft y OpenAI saben que esta inteligencia artificial puede utilizarse para suplantar la identidad de los ciudadanos. Actualmente, ambas compañías están buscando un método que les permita diferenciar los audios generados por esta IA con los que fueron grabados por personas reales.