Cargando...
Opinión

¿Qué libros puede leer una IA?, por Ragi Burhum

"ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra".

larepublica.pe
RAGI

Para entrenar un LLM (como ChatGPT) una organización necesita recolectar y ordenar muchos datos. Imagina una persona en sus primeros años de vida que empieza a aprender sobre el mundo. ¿Qué información puede utilizar legalmente para aprender? Esta pregunta puede sonar algo absurda, pero en el contexto de Inteligencia Artificial choca directamente con nuestra interpretación actual de qué son derechos de autor y fair use (“uso justo” en inglés).

El New York Times decidió enjuiciar a OpenAI y Microsoft por utilizar artículos del periódico para entrenar sus modelos de IA. Eso se venía y era inevitable por la cantidad de dinero de por medio.

ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra. Crear la mejor información sobre uno de estos eventos implica gastos económicos como contratar periodistas y enviarlos a distintas partes del mundo. Gastos que no son compartidos por los dueños de ChatGPT, a pesar que sí están monetizando parte de esa información indirectamente.

En el 2006 ocurrió algo similar entre “Field vs. Google” donde la pregunta principal era si Google podía indexar el contenido de internet. Como muchos saben, Google tiene varios programas que van constantemente por todo internet, graban copias de pedazos importantes en su base de datos local (un “caché”) y crean un índice gigante de todo lo que encuentra. Cuando utilizamos un buscador, ese índice, devuelve los resultados instantáneamente.

Si Google hubiera perdido este caso, donde se definió indexar contenido de todo internet –incluyendo material con derechos de autor–, viviríamos en otro mundo, uno sin Google. En ese juicio se llegó a la conclusión que indexar todo sí era válido, “fair use”, y por lo tanto no se tenía que remunerar a nadie. También fue la base para definir otras reglas de juego, como por ejemplo, cómo pedirle a Google que borre contenido de su caché.

El caso del NYT vs. OpenAI/Microsoft va a ser igual de importante porque va a definir qué documentos, redes sociales, o cualquier tipo de publicaciones vamos a poder utilizar para entrenar una IA y los resultados van a ser radicalmente distintos.

Lo más visto

No podía ser verdad tanta belleza, por Mirko Lauer

LEER MÁS

Un cucurucho, por Jorge Bruce

LEER MÁS

Pobre gente de París, por Eduardo González Viaña

LEER MÁS

Recetas

Ofertas

Lo Más Reciente

Opinión

Un metro de tierra para José Santos Chocano, por Eduardo González Viaña

Ralentizar el progreso: la operación pictórica de Iosu Aramburu, por Leyla Aboudayeh

Gabinete con prontuario

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

Alto Comisionado de la ONU alerta sobre ataques a la independencia judicial en Perú: "Estoy preocupado por la separación de poderes"

Alcaldes en zozobra por asesinatos: “No sabemos quién será el próximo”

Alfonso López Chau niega trámite para obtener residencia mexicana: "Cuando he viajado ha sido por estudios"

Deportes

André Carrillo y Corinthians protestan contra el racismo: respaldan a Vinícius Júnior con fuerte mensaje

FC Barcelona vs Newcastle: día, hora y canal de TV del partido por los octavos de final de la Champions League

PSG vs Chelsea: día, hora y canal de TV del partido por los octavos de final de la Champions League