Ciencia

ChatGPT es capaz de aprobar el examen para ejercer de médico en Estados Unidos

Científicos pusieron a prueba esta herramienta de inteligencia artificial y consiguieron resultados sorprendentes.

ChatGPT, la inteligencia artificial del momento, puede ayudarte a aprobar uno de los exámenes más difíciles a nivel mundial. Foto: AFP
ChatGPT, la inteligencia artificial del momento, puede ayudarte a aprobar uno de los exámenes más difíciles a nivel mundial. Foto: AFP

Sin duda, ChatGPT es la inteligencia artificial del momento. ¿El motivo? Con simples indicaciones, este robot virtual es capaz de generar textos tan coherentes que fácilmente pueden aparentar haber sido escritos por un ser humano. Así, el chatbot ya está siendo utilizado para redactar desde ensayos complejos hasta investigaciones académicas.

Ahora, un equipo de científicos ha anunciado que ChatGPT cumplió otro logro: aprobar parcialmente el Examen de Licencias Médicas de los Estados Unidos (USMLE, por sus siglas en inglés), una de las evaluaciones más difíciles de pasar a nivel internacional.

El USMLE es una serie de tres exámenes altamente estandarizados que toman los estudiantes de Medicina de EE. UU. y otros países para ejercer de médico en la nación norteamericana. Abarca la mayoría de las disciplinas esenciales en este rubro, tales como bioquímica, razonamiento diagnóstico y bioética.

“Alcanzar la puntuación de aprobación para este examen experto notoriamente difícil, y hacerlo sin ningún refuerzo humano, marca un hito notable en la maduración clínica de la IA”, dijeron los autores, quienes este 9 de febrero han publicado su estudio en la revista PLOS Digital Health.

El desempeño de ChatGPT fue puesto a prueba en 350 de las 376 preguntas del último USMLE que se encuentra disponible al público. Después de eliminar las respuestas ambiguas, la inteligencia artificial obtuvo una puntación entre 52% y 75% en las tres evaluaciones.

Cabe precisar que el umbral de precisión requerido para aprobar el USMLE bordea el 60%.

Según Kung y sus colegas, ChatGPT también demostró una concordancia del 95% en todas sus respuestas, de las cuales, además, el 89% tenía al menos una idea significativa, es decir, un enunciado nuevo y válido.

"ChatGPT contribuyó sustancialmente a la redacción de (nuestro) manuscrito... Interactuamos con ChatGPT como un colega, pidiéndole que sintetice, simplifique y ofrecer contrapuntos a los borradores en curso", sostuvo la Dra. Tiffany Kung, una de las autoras del estudio.

Tras este resultado, ChatGPT ha superado el rendimiento de PubMedGPT, una inteligencia artificial similar formada exclusivamente en la literatura médica cuya puntuación era del 51%.