Cargando...
Opinión

¿Qué libros puede leer una IA?, por Ragi Burhum

"ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra".

larepublica.pe
RAGI

Para entrenar un LLM (como ChatGPT) una organización necesita recolectar y ordenar muchos datos. Imagina una persona en sus primeros años de vida que empieza a aprender sobre el mundo. ¿Qué información puede utilizar legalmente para aprender? Esta pregunta puede sonar algo absurda, pero en el contexto de Inteligencia Artificial choca directamente con nuestra interpretación actual de qué son derechos de autor y fair use (“uso justo” en inglés).

El New York Times decidió enjuiciar a OpenAI y Microsoft por utilizar artículos del periódico para entrenar sus modelos de IA. Eso se venía y era inevitable por la cantidad de dinero de por medio.

ChatGPT no puede comentar o incorporar información sobre noticias si no las lee, por ejemplo, del estado de una guerra. Crear la mejor información sobre uno de estos eventos implica gastos económicos como contratar periodistas y enviarlos a distintas partes del mundo. Gastos que no son compartidos por los dueños de ChatGPT, a pesar que sí están monetizando parte de esa información indirectamente.

En el 2006 ocurrió algo similar entre “Field vs. Google” donde la pregunta principal era si Google podía indexar el contenido de internet. Como muchos saben, Google tiene varios programas que van constantemente por todo internet, graban copias de pedazos importantes en su base de datos local (un “caché”) y crean un índice gigante de todo lo que encuentra. Cuando utilizamos un buscador, ese índice, devuelve los resultados instantáneamente.

Si Google hubiera perdido este caso, donde se definió indexar contenido de todo internet –incluyendo material con derechos de autor–, viviríamos en otro mundo, uno sin Google. En ese juicio se llegó a la conclusión que indexar todo sí era válido, “fair use”, y por lo tanto no se tenía que remunerar a nadie. También fue la base para definir otras reglas de juego, como por ejemplo, cómo pedirle a Google que borre contenido de su caché.

El caso del NYT vs. OpenAI/Microsoft va a ser igual de importante porque va a definir qué documentos, redes sociales, o cualquier tipo de publicaciones vamos a poder utilizar para entrenar una IA y los resultados van a ser radicalmente distintos.

Lo más visto

Las paradojas de la pobreza compartida de migrantes venezolanos y peruanos, por Javier Herrera

LEER MÁS

Quién ganó o perdió en 2025, por Mirko Lauer

LEER MÁS

Ofertas

Lo Más Reciente

Opinión

Ribeyro y una broma en Frankfurt, por Eduardo González Viaña

La seguridad a los 80 días de Jerí, por César Azabache Caracciolo

Sobre la exposición “Transitar la Luna” de Patrick Tschudi, por Czar Gutiérrez

Estados Unidos

Elecciones en Nueva York 2025: Zohran Mamdani gana la alcaldía y triunfo le da un fuerte golpe a la era Trump

El 11S el atentado terrorista con más víctimas de la historia: alrededor de 3.000 afectados y cuestionó la seguridad global

Estos son los 5 mejores destinos del mundo para hacer trekking: están en Estados Unidos, España y Perú

Política

ONPE decide no usar voto digital en elecciones generales 2026 tras informe del JNE

Elecciones 2026: las nuevas caras de los partidos para los próximos comicios

Carlos León Moya: “En esta elección se ha mediocrizado mucho la derecha, sí. Pero también la izquierda”.

Deportes

Federico Guirotti a un paso de Alianza Lima: el delantero argentino llegó a un acuerdo con los blanquiazules

Caín Fara y su emotivo mensaje al ser presentado como el flamante fichaje de Universitario: "Soy consciente de lo gigante que es"

Luis Ramos y su promesa al ser anunciado como el flamante fichaje de Alianza Lima: "Estoy aquí para darles el título 2026"