La aparición de ChatGPT ha causado mucho asombro en la internet por las múltiples capacidades que tiene para realizar tareas. Ya sea para resumir o corregir textos, para responder como si fuera especialista en algún tema en específico o simplemente para contar chistes. Por ello, muchos expertos están realizando distintos estudios para poder evaluar a profundidad qué tan bueno es esta IA en específico en algunos campos.
Recientemente, un grupo de investigadores de la Universidad del Sur de California decidió someter a ChatGPT 3.5 a un estudio para comprobar su capacidad creativa al momento de crear chistes. Como parte de la investigación, compararon la habilidad humorística de la IA con la de personas sin experiencia en la comedia y con otros que eran profesionales. ¿Quieres conocer los resultados? En esta nota te los mostraremos.
En este primer escenario, los investigadores pidieron a tres adultos sin experiencia en la comedia que completaran 3 tareas relacionadas con la generación de chistes. Lo mismo se les pidió a ChatGPT. Los resultados serían evaluados por un grupo independiente de personas, quienes calificarían el nivel de humor de los chistes.
Los resultados arrojaron que los chistes de Chat GPT-3.5 fueron más graciosos que los de los adultos sin experiencia en la comedia. De manera estadística, el 69.5% de los evaluadores prefirieron el humor generado por la inteligencia artificial que por los humanos.
'Este resultado nos pareció particularmente interesante por la naturaleza agresiva de la tarea. Dado que ChatGPT está diseñado para no generar ningún discurso que pueda considerarse ofensivo u odioso, se podría haber hecho la predicción opuesta', indicaron los investigadores.
Para este segundo escenario, los investigadores cambiaron a los participantes y las tareas. Ahora Chat GPT 3.5 se enfrentaría a comediantes profesionales en la generación de titulares de noticias satíricas. Los responsables de evaluar el nivel de humor de estos titulares estarían a cargo de un grupo de estudiantes de psicología.
En este caso, la creatividad humana se sobrepuso a la inteligencia artificial. El 48.8% de los estudiantes prefirieron los titulares satíricos que fueron creados por los expertos en comedia, mientras que el 36.9% prefirió los titulares que fueron generados por el Chat GPT 3.5.
'En promedio, los participantes calificaron los titulares como igualmente divertidos, lo que indica que el participante promedio no percibió una diferencia en la calidad', dijeron los investigadores. Asimismo, señalaron que les pareció interesante este resultado, ya que ahora se comparó la creatividad humorística de ChatGPT con aquellos que se dedican profesionalmente al humor.
Al final del estudio, los investigadores sugieren que estos resultados tendrían grandes implicaciones en la industria del entretenimiento, sobre todo en la dedicada al humor. 'Para los escritores de comedia profesionales, nuestros resultados sugieren que los LLM (Modelos de Lenguaje Grande como ChatGPT) pueden representar una grave amenaza laboral', advirtieron los responsables del estudio.
Asimismo, los investigadores argumentaron que 'dado que ChatGPT no puede sentir emociones por sí mismo, pero cuenta chistes nuevos mejor que el humano promedio, estos estudios proporcionan evidencia de que no es necesario sentir las emociones para apreciar un buen chiste y contar uno realmente bueno'.