Tecnología

¿La IA logró imitar a los humanos? Estudio demostraría que GPT-4 superó la prueba de Turing

La inteligencia artificial ha logrado un desarrollo extraordinario en tan poco tiempo que habría superado la famosa prueba propuesta por Turing. Entérate aquí de qué trata todo esto.

Para la aplicación de esta prueba de Turing, se utilizaron tres inteligencias artificiales. Foto: MMMAcademy
Para la aplicación de esta prueba de Turing, se utilizaron tres inteligencias artificiales. Foto: MMMAcademy

Desde la popularización de la inteligencia artificial (IA), muchas personas se han sorprendido por su alta capacidad de imitar varios trabajos humanos casi a la perfección. Esto ha llevado a pensar acerca de si llegará el momento en que esta tecnología logre engañar a los humanos y hacerse pasar por uno de ellos. Una de las medidas para comprobar esto es el uso de la prueba de Turing.

Pues bien, recientemente un grupo de científicos aplicó este famoso test con GPT-4 y otras inteligencias artificiales más populares. Los resultados dejaron sorprendidos a los científicos por la gran cantidad de personas que fueron engañadas por la IA. En esta nota te contamos todo sobre este estudio.

¿Qué es la prueba de Turing?

Este famoso test fue propuesto en 1950 por el reconocido científico de la computación Alan Turing. La prueba, publicada en su ensayo 'Computing Machinery and Intelligence', pone en evaluación la capacidad que tiene la inteligencia artificial para imitar el comportamiento humano. El desarrollo del test se da de la siguiente manera: Un humano tendrá que conversar con una IA y con otra persona viva.

Luego de ello, tendrá que responder si logra discernir quién de las dos era una máquina y quién un ser humano. Si ocurriese que la persona no puede responder de manera correcta, se considera que la IA superó la prueba. En ese caso, se señala que la máquina ha alcanzado una inteligencia similar a la de un ser humano.

GPT-4 logró superar la prueba de Turing

Para la aplicación de esta prueba, los investigadores pidieron a distintas personas que conversaran con cuatro agentes: tres serían inteligencias artificiales y uno sería un humano. Las IA que se utilizaron para este experimento fueron ELIZA (una inteligencia artificial de la década de 1960), GPT-3.5 y GPT-4. Estas dos últimas son utilizadas para el funcionamiento del popular ChatGPT.

Durante la investigación, los participantes sostuvieron conversaciones que duraron 5 minutos. Luego se les preguntó si lograban discernir quiénes de los agentes con los que conversaron eran inteligencias artificiales y quién era el ser humano.

Los resultados arrojaron que el 54% de los participantes pensaron que GPT-4 era un ser humano, el 50% pensó lo mismo de GPT-3.5 y, finalmente, solo el 20% creyó que ELIZA era una persona viva. "Las máquinas pueden estar sujetas a sesgos cognitivos, ser engañadas y manipuladas, y se están volviendo cada vez más engañosas. Todos estos elementos significan que en los sistemas de IA se expresan debilidades y peculiaridades humanas, lo que los hace más parecidos a los humanos", dijo Nell Watson, investigadora de IA en el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE).

Sin embargo, los científicos señalan que existen críticas válidas al test de Turing, ya que tiene un enfoque muy simplista al centrarse más en aspectos socioemocionales que en factores asociados a la inteligencia tradicional. A pesar de ello, Watson agrega que este estudio cambiará la manera en que los humanos interactúan con la inteligencia artificial, puesto que ahora adoptarán una actitud más paranoica acerca de la verdadera naturaleza de estas interacciones.