Este mes Microsoft anunció la integración de una versión personalizada de ChatGPT a su motor de búsqueda online Bing. Como se sabe, Microsoft ha decidido invertir alrededor de US$10 mil millones de USD en OpenAI, creadores de ChatGPT, para integrarlo a varios de sus productos como Bing, Office, Windows, etc.
En respuesta, esta semana Google anunció Google Bard mediante un blog post con la promesa de estar disponible para uso masivo en unas semanas. Sin embargo, su lanzamiento no ha sido sin problemas. Durante un video de propaganda, un ejemplo de Google Bard dio resultados inexactos, y esto no pasó desapercibido por muchos. A causa de esto, en dos días, Google ha tenido una caída del 8% en la capitalización de sus acciones (efectivamente una reducción de más de 100 mil millones de dólares del valor de la empresa).
PUEDES VER: ¿Qué significan los stickers que tiene tu laptop y por qué no se recomienda quitarlos? Te diremos
Es difícil saber quién va a ganar esta guerra de esta nueva generación de buscadores con motores de IA. Conseguir código libre que sea equivalente en funcionalidad no es difícil —ese no es el factor decisivo, poder tener acceso a un corpus de datos relevantes para entrenar los modelos de IA sí lo es— agregando el pequeño detalle que existen pocas compañías que pueden absorber el costo de entrenamiento de 50M USD por mes.
Al final del día, los datos de entrenamiento son los que afectan realmente la calidad de los resultados. Por ejemplo, los sesgos políticos o interpretación de ciertos hechos históricos en los libros o páginas web que se han usado para entrenar los modelos afectan las respuestas directamente. Es inevitable que esto sea materia de discusión sobre guerras culturales. Esto no es algo nuevo; existen varios ejemplos de como datos de entrenamiento han afectado negativamente a sistemas de reconocimiento facial o en la filtración de los CV para contratar nuevo personal.
Microsoft y Google tienen acceso a varios repositorios de información similares (e.g. Internet, libros, etc.), pero también a muchos que son exclusivos (GMail, YouTube, Outlook Mail, GitHub, LinkedIn, etc.). Es en ese segundo grupo que la guerra sobre IA se vuelve un área gris que va a incluir discusiones sobre privacidad, productos derivados y derechos de autor.
Científico en Computación (California State University) y emprendedor en serie de dos startups en Silicon Valley. 20+ años creando sistemas de información geográfica en compañías como ESRI (ArcGIS), Microsoft(MS Flight Simulator), NVIDIA y AmigoCloud. Creyente (casi fanático) del poder de Open Data (datos abiertos) y Open Source (código libre).