Desde hace meses se rumoreaba que GPT-4, el nuevo modelo de lenguaje de OpenAI, sería presentado en algún momento del primer semestre de 2023. Ahora, gracias a la confirmación de Microsoft, uno de los inversores más importantes de la startup de inteligencia artificial, sabemos que el lanzamiento está a punto de producirse. En este sentido, el mundo tendrá la oportunidad de conocer las capacidades de esta nueva herramienta de procesamiento del lenguaje natural en muy poco tiempo.
La información que ha trascendido sobre GPT-4 ha sido escasa, pero Microsoft ha dado a conocer un detalle importante: este modelo de lenguaje será multimodal. En esencia, GPT-4 tendrá la capacidad de interpretar tanto texto como imágenes. En otras palabras, este nuevo modelo de procesamiento del lenguaje natural permitirá una mayor interacción con el mundo visual.
Hasta ahora, la versión anterior de GPT, que ha sido la base de modelos como ChatGPT, solo era capaz de producir texto. Con la llegada de GPT-4, esto cambiará. La capacidad de procesar imágenes permitirá a este modelo de lenguaje una mayor comprensión del mundo que lo rodea, y por tanto, una mayor capacidad para generar respuestas coherentes y adecuadas.
Aunque habrá que esperar al anuncio oficial para conocer todas las novedades que presenta GPT-4, este avance supone un gran paso adelante en la investigación en procesamiento del lenguaje natural. De esta manera, con GPT-4 sería posible generar texto, imágenes, vídeos e incluso música.
Por su parte, Andreas Braun, director de tecnología de Microsoft Alemania, ha afirmado que este modelo de lenguaje dará un paso más en la aproximación a la capacidad de interpretación humana. Sin embargo, también ha reconocido que todavía queda un largo camino por recorrer para alcanzar el nivel de comprensión del lenguaje humano.
Una de las ventajas más destacadas de GPT-4 como modelo de lenguaje multimodal es su capacidad para gestionar la entrada y salida de datos en diferentes idiomas. Esto significa que, por ejemplo, ChatGPT podría recibir una petición en español y generar una respuesta en inglés. De esta forma, se podrán generar respuestas coherentes y adecuadas.