Cargando...
Opinión

¿Qué libros puede leer una IA?, por Ragi Burhum

"ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra".

larepublica.pe
RAGI

Para entrenar un LLM (como ChatGPT) una organización necesita recolectar y ordenar muchos datos. Imagina una persona en sus primeros años de vida que empieza a aprender sobre el mundo. ¿Qué información puede utilizar legalmente para aprender? Esta pregunta puede sonar algo absurda, pero en el contexto de Inteligencia Artificial choca directamente con nuestra interpretación actual de qué son derechos de autor y fair use (“uso justo” en inglés).

El New York Times decidió enjuiciar a OpenAI y Microsoft por utilizar artículos del periódico para entrenar sus modelos de IA. Eso se venía y era inevitable por la cantidad de dinero de por medio.

ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra. Crear la mejor información sobre uno de estos eventos implica gastos económicos como contratar periodistas y enviarlos a distintas partes del mundo. Gastos que no son compartidos por los dueños de ChatGPT, a pesar que sí están monetizando parte de esa información indirectamente.

En el 2006 ocurrió algo similar entre “Field vs. Google” donde la pregunta principal era si Google podía indexar el contenido de internet. Como muchos saben, Google tiene varios programas que van constantemente por todo internet, graban copias de pedazos importantes en su base de datos local (un “caché”) y crean un índice gigante de todo lo que encuentra. Cuando utilizamos un buscador, ese índice, devuelve los resultados instantáneamente.

Si Google hubiera perdido este caso, donde se definió indexar contenido de todo internet –incluyendo material con derechos de autor–, viviríamos en otro mundo, uno sin Google. En ese juicio se llegó a la conclusión que indexar todo sí era válido, “fair use”, y por lo tanto no se tenía que remunerar a nadie. También fue la base para definir otras reglas de juego, como por ejemplo, cómo pedirle a Google que borre contenido de su caché.

El caso del NYT vs. OpenAI/Microsoft va a ser igual de importante porque va a definir qué documentos, redes sociales, o cualquier tipo de publicaciones vamos a poder utilizar para entrenar una IA y los resultados van a ser radicalmente distintos.

Lo más visto

Ribeyro y una broma en Frankfurt, por Eduardo González Viaña

LEER MÁS

"Memento amori": amar es resistir a la lógica neoliberal, por Leyla Aboudayeh

LEER MÁS

Chabuca Granda, Victoria Angulo y la historia de “La flor de la canela”, por Eduardo González Viaña

LEER MÁS

La democracia también se cuida en cómo discutimos

LEER MÁS

Ofertas

Lo Más Reciente

Opinión

El largo sueño de Natán, por Eduardo González Viaña

Chabuca Granda, Victoria Angulo y la historia de “La flor de la canela”, por Eduardo González Viaña

Un territorio ocupado es un cuerpo ocupado, por Las Tejedoras

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

Fuerza Popular, Perú Libre y otros 8 partidos deben rendir cuentas por uso de S/7 millones del Estado

Primero la Gente presenta ante el JEE solicitud de inscripción de plancha presidencial de Marisol Pérez Tello

Elecciones 2026: 32 partidos siguen en carrera, mientras que 3 corren el riesgo de ser excluidos

Deportes

Barcelona vs Racing de Santander EN VIVO: alineaciones, hora y canal de TV para ver partido de la Copa del Rey 2026

Jorge Fossati y su contundente mensaje sobre Javier Rabanal tras fichar por Universitario: "Es el técnico que ellos quieren"

Partidos de hoy, 15 de enero de 2026: horarios y canales para ver la Copa del Rey, Serie A y Bundesliga