Tecnología

Gigantes editoriales demandan a Meta por «piratería masiva» de libros para su IA Llama

11 de mayo de 2026 2:21 PM

Pila de libros abiertos con páginas escaneadas ilegalmente para entrenar IA, incluyendo títulos como 'La quinta estación' de N.K. Jemisin

Robo de conocimiento a escala: Las mayores editoriales del mundo, incluyendo Elsevier, Hachette y McGraw Hill, han presentado una demanda histórica contra Meta. Acusan a la compañía de usar millones de libros protegidos —desde obras literarias premiadas hasta manuales científicos— obtenidos de fuentes piratas para entrenar su modelo de inteligencia artificial Llama.

La acción legal, respaldada por figuras como el escritor Scott Turow (expresidente del Gremio de Autores de EE.UU.), revela que Meta recurrió a repositorios ilegales para acceder a materiales sin autorización. Entre las obras afectadas se encuentran títulos como «La quinta estación» de N.K. Jemisin (ganadora del premio Hugo), «El robot salvaje» de Peter Brown, y millones de artículos académicos de Elsevier, cuyo acceso legal cuesta miles de dólares al año.

¿Innovación tecnológica o el mayor saqueo digital de la historia?

Maria Pallante, presidenta de la Asociación Estadounidense de Editores, calificó estas acciones como «infracción industrializada». «La inteligencia artificial no puede construirse sobre el expolio sistemático. Si las Big Tech eligen la piratería sobre la creación, el progreso real se desvanecerá», declaró en un comunicado oficial.

El conflicto trasciende lo ético: los demandantes aseguran que Meta copió textos completos, incluyendo diagramas médicos y fórmulas matemáticas de manuales universitarios, sin permiso ni compensación económica. Documentos internos filtrados indican que el modelo Llama 2 fue entrenado con datasets que incluían 170 GB de libros escaneados ilegalmente, equivalentes a más de 100 millones de páginas de contenido protegido.

El precedente de US$1.500 millones: ¿Cuánto podría perder Meta?

El caso establece un paralelo preocupante. En junio de 2024, Anthropic —apoyada por gigantes como Amazon y GoogleUS$1.500 millones para resolver una demanda similar presentada por autores y medios. Los abogados de las editoriales estiman que, de perder, Meta podría enfrentar una indemnización aún mayor, considerando:

El volumen de obras pirateadas supera en 10 veces el caso de Anthropic.
Meta registró ganancias récord de US$46.000 millones en 2023, un factor que podría influir en un fallo ejemplar.
Las editoriales exigen daños punitivos por lo que describen como una «conducta deliberada y sistemática».

Gigantes editoriales demandan: La defensa de Meta se basa en el concepto de fair use (uso legítimo), argumentando que sus modelos de IA «transforman» el material original. Sin embargo, los demandantes presentan un contraargumento contundente: Llama 2 es capaz de reproducir párrafos enteros de los libros pirateados cuando se le solicita, lo que debilita la tesis de la «transformación creativa».

La defensa de Meta se basa en el concepto de fair use (uso legítimo), argumentando que sus modelos de IA «transforman» el material original. Sin embargo, los demandantes presentan un contraargumento contundente: Llama 2 es capaz de reproducir párrafos enteros de los libros pirateados cuando se le solicita, lo que debilita la tesis de la «transformación creativa».

«No estamos pidiendo limosnas; exigimos que se pague por lo robado«, declaró un portavoz de McGraw Hill, cuya división educativa genera US$1.200 millones anuales solo en libros de texto.

El fair use bajo escrutinio: ¿Un argumento con fisuras?

Meta insiste en que su uso de los materiales está amparado por el fair use, alegando que sus modelos de IA crean algo nuevo a partir de los datos de entrenamiento. No obstante, los demandantes señalan que Llama 2 puede replicar fragmentos textuales completos, lo que contradice la idea de una «transformación» legítima.

«Esto no es innovación; es fotocopiar a escala industrial«, afirmó Scott Turow durante una conferencia de prensa. Este caso se suma a una ola de demandas contra otras empresas tecnológicas, como OpenAI (creadora de ChatGPT), Stability AI y Google, acusadas de emplear métodos similares. La pregunta clave que resuena en Silicon Valley es: ¿Puede la inteligencia artificial avanzar sin violar los derechos de autor?

Un tuit del abogado @TechLawGuru, que se volvió viral, resume el debate: «Si un estudiante escanea 100 libros de la biblioteca para su tesis, es expulsado. Si una empresa valorada en US$1 billón hace lo mismo para entrenar una IA, es disrupción. ¿Doble moral?«.

Propiedad intelectual en riesgo: ¿Hacia un colapso de la creación?

Este litigio expone una paradoja crítica: las inteligencias artificiales dependen de contenido creado por humanos para funcionar, pero su modelo de negocio actual elimina los incentivos para producir nuevo conocimiento. Un estudio de la Universidad de Oxford (2023) advierte que, si las Big Tech no remuneran a los creadores por el uso de sus obras, para 2030 el 40% de los autores profesionales podrían abandonar la industria.

Las implicaciones van más allá de lo económico:

Científicos temen que, sin licencias adecuadas, las IA puedan reproducir errores de estudios pirateados. Ya ocurrió con un modelo de Google que citó un estudio retractado sobre vacunas.
Editores educativos advierten que los libros de texto podrían aumentar su precio en un 30% para compensar las pérdidas por piratería.
Autores como N.K. Jemisin han anunciado que retirarán sus obras de la circulación digital si no se garantizan regalías justas.

«Estamos al borde de un apagón cultural«, advirtió Maria Pallante. «Si no se protege la propiedad intelectual, ¿quién escribirá el próximo best-seller o descubrirá la cura del cáncer si sabe que su trabajo será saqueado sin consecuencias?».

¿Un acuerdo histórico o el inicio de una guerra legal sin precedentes?

Expertos como Ben Thompson (autor de Stratechery) vislumbran tres posibles desenlaces:

Victoria de las editoriales: Meta podría verse obligada a pagar licencias retroactivas por hasta US$3.000 millones y establecer un fondo para futuros usos. Esto beneficiaría a empresas como Elsevier, cuyas acciones han subido un 27% en 2024.
Triunfo de Meta: Una interpretación ampliada del fair use sentaría un precedente peligroso para los creadores. «Sería el Napster 2.0«, según Scott Turow.
Solución híbrida: Un modelo de «licencia colectiva», similar al de la música en plataformas como Spotify, donde las IA paguen un canon por acceder a catálogos completos de obras protegidas.

Mientras el juzgado de Manhattan se prepara para las primeras audiencias, el caso trasciende lo económico: se trata de quién controlará el conocimiento en el siglo XXI. Como escribió N.K. Jemisin en un editorial para The Atlantic: «Si la IA se entrena con nuestro trabajo sin consentimiento ni compensación, no es inteligencia artificial; es esclavitud algorítmica«.

El precedente oculto: Cómo la industria musical ya vivió (y perdió) esta batalla

La demanda contra Meta no es la primera vez que una industria creativa se enfrenta a un gigante tecnológico por el uso no autorizado de su contenido. **El caso más cercano —y advertencia— es el de Napster en los 2000**, cuando la música digital fue «liberada» masivamente sin compensación a artistas ni sellos. La diferencia ahora: **el saqueo no es para consumo humano, sino para alimentar máquinas que luego compiten con los mismos creadores**.

En 2001, un tribunal ordenó el cierre de Napster por violación de derechos de autor. Pero el daño ya estaba hecho: la industria musical **perdió el 50% de sus ingresos en una década**, según la RIAA. Hoy, los autores y editoriales temen un efecto similar. **Un informe de la Autoridad Europea de Valores (2023) señala que el 68% de los datasets de IA incluyen material con derechos no aclarados**, desde letras de canciones hasta guiones de cine. La diferencia clave: **Meta no es un adolescente compartiendo MP3, sino una corporación que monetiza el resultado**.

El paralelo más inquietante es el **caso *Google Books*** (2015), donde el tribunal falló a favor del *fair use* al considerar que la digitalización masiva de libros para búsquedas no dañaba el mercado. Pero hay una brecha crítica: **Google no entrenaba IA que luego reemplazara a los autores**; solo mostraba fragmentos. Hoy, modelos como Llama **generan textos que compiten directamente con las obras originales**, desde resúmenes académicos hasta novelas derivadas.

Lección no aprendida: Tras Napster, la industria musical tardó 15 años en recuperarse con modelos como Spotify. Los libros podrían enfrentar un **vacío legal más largo**: no hay un «Netflix de los libros» con licencias claras para IA.
El riesgo sistémico: Si Meta gana, **el 80% de los datasets de IA podrían provenir de fuentes no licenciadas**, según estimaciones de *The Future of Privacy Forum*. Esto afectaría no solo a editoriales, sino a startups que sí pagan por datos limpios.
El efecto dominó: Países como **Japón y Corea del Sur ya exigen que las IA revelen sus fuentes de entrenamiento**. Si EE.UU. no actúa, podría convertirse en un **paraíso para la piratería algorítmica**, como ocurrió con las webs de streaming ilegal en los 2010.

La paradoja del progreso: ¿Innovación a costa de borrar la creatividad?

El núcleo del conflicto no es técnico, sino filosófico: **¿Puede una sociedad incentivar la innovación mientras desincentiva la creación de su materia prima?** Históricamente, los avances como la imprenta o la fotografía generaron tensiones similares, pero siempre hubo un **mecanismo de compensación** (como los derechos de reproducción). Hoy, la IA **rompe ese ciclo**: consume contenido humano para producir más contenido, sin retorno claro para los originadores.

Un dato revelador: **en 2023, el 12% de los libros autoeditados en Amazon fueron generados total o parcialmente por IA**, según *Bowker*. Si el modelo de Meta se normaliza, esa cifra podría superar el **30% en 2027**, ahogando a autores emergentes. La pregunta incómoda es si estaremos dispuestos a aceptar un futuro donde **la cultura sea un loop de máquinas reciclando máquinas**, sin voz humana nueva que lo alimente.

Referencia de contenido: consultar fuente original aquí

Etiquetado:noticias el colombiano