Entrenamiento de IA con libros: Una empresa de inteligencia artificial recurrió a un método radical para mejorar sus modelos.
En 2024, Anthropic, la compañía detrás del asistente de IA Claude, puso en marcha el Proyecto Panamá, una operación secreta con un objetivo claro: alimentar a sus modelos de lenguaje con millones de libros físicos en lugar de confiar en el «lenguaje de baja calidad» que domina internet. La premisa era ambiciosa: enseñar a la IA a «escribir bien», imitando la prosa pulida de obras literarias, ensayos académicos y textos editados profesionalmente.
El proceso era metódico y a gran escala. Primero, la empresa adquiría libros usados a través de minoristas especializados, como The Strand (la icónica librería de Nueva York), Better World Books (EE.UU.) y World of Books (Reino Unido). Luego, cada volumen pasaba por una máquina de corte hidráulica que lo desmontaba con «precisión quirúrgica», según documentos internos. Las páginas se escaneaban una por una con tecnología profesional de alta velocidad, y los datos se integraban en el modelo de lenguaje de Claude. Finalmente, los restos de papel se enviaban a plantas de reciclaje: «No había que desperdiciar nada«, justificaba la empresa.

El Washington Post calcula que, en solo seis meses, Anthropic adquirió entre 500,000 y 2 millones de libros, con un coste de «decenas de millones de dólares». La operación, sin embargo, no era filantrópica: buscaba explotar una laguna legal conocida como «doctrina de la primera venta», que permite a los compradores de copias físicas usarlas sin restricciones de derechos de autor. Lo que la ley no anticipaba era que alguien las destruyera sistemáticamente para convertirlas en datos.
El Proyecto Panamá: ¿genialidad técnica o expolio cultural?
El Proyecto Panamá era, en esencia, una cadena de montaje inversa: en lugar de fabricar productos, los desintegraba para extraer su contenido. Esta práctica, aunque técnicamente legal bajo la doctrina de la primera venta, planteaba un dilema ético: ¿Es justo destruir patrimonio cultural con fines comerciales? Anthropic lo mantuvo en secreto, consciente de que la opinión pública podría tacharlo de «saqueo organizado».
La filtración llegó en enero de 2025, cuando un juez desclasificó documentos vinculados a una demanda colectiva por violación de derechos de autor. Los demandantes argumentaban que, aunque la compra de libros usados era legal, su uso masivo para entrenar IA constituía una infracción. El caso se cerró en septiembre de 2024 con un acuerdo histórico: Anthropic pagó 1,500 millones de dólares, una de las multas más altas en el sector tecnológico.
La polémica no era nueva. Empresas como OpenAI y Meta ya habían sido acusadas de utilizar bibliotecas piratas (como LibGen o Z-Library) para alimentar sus modelos. Sin embargo, el enfoque de Anthropic era distinto: en lugar de descargar copias digitales ilegales, compraba ejemplares físicos para destruirlos. Esto le permitía argumentar que actuaba dentro del marco legal, aunque la moralidad del método seguía en entredicho.
Del pirata digital al «reciclaje» masivo de libros
Antes de lanzar el Proyecto Panamá, Anthropic ya había explorado vías menos… ortodoxas. En 2021, Ben Mann, cofundador de la empresa, descargó personalmente millones de libros desde Library Genesis (LibGen), un repositorio conocido por distribuir obras con derechos de autor sin permiso. Un año después, Mann incluso elogió públicamente a Pirate Library Mirror, un sitio que se jactaba de violar «deliberadamente» las leyes de propiedad intelectual.
El giro hacia los libros físicos no fue casual. Según los fiscales, Anthropic buscaba cubrirse legalmente aprovechando la doctrina de la primera venta, que ampara el uso libre de copias adquiridas legítimamente. Sin embargo, el cambio de estrategia no la eximió de responsabilidades: el acuerdo de 1,500 millones incluyó tanto las acusaciones por piratería digital como por el uso masivo de obras físicas sin compensar a los autores.
El caso expuso una paradoja del sector: las empresas de IA necesitan enormes cantidades de texto de calidad para entrenar sus modelos, pero raramente pagan por ello. Mientras los escritores y editores ven cómo sus obras se convierten en «combustible» para algoritmos, las compañías argumentan que están impulsando el «progreso tecnológico». ¿Quién gana en esta ecuación? Los documentos desclasificados revelan que Anthropic llegó a gastar hasta 30 dólares por libro en algunos casos, un precio elevado para ejemplares usados, pero irrisorio comparado con los beneficios potenciales de una IA más avanzada.
El futuro de los libros en la era de la IA
El Proyecto Panamá plantea preguntas incómodas sobre el destino del libro físico en la era digital. Si una empresa puede comprar y destruir medio millón de obras en seis meses, ¿qué impide que otras hagan lo mismo a mayor escala? Los críticos advierten de un escenario donde las librerías de segunda mano se conviertan en «canteras de datos» para corporaciones tecnológicas, mientras los autores reciben cero compensación.
Anthropic defendió su método alegando que los libros usados ya habían «cumplido su ciclo comercial», pero omitió mencionar que muchos de ellos seguían siendo obras en venta o con valor histórico. El Washington Post citó el caso de un libro raro de los años 50, adquirido por la empresa y destruido, cuya única copia disponible en el mercado desapareció para siempre.
El acuerdo judicial obligó a Anthropic a revisar sus prácticas, pero no frenó el debate. Mientras, otras empresas de IA observan con atención: si el «reciclaje» de libros resulta rentable, ¿cuántas seguirán este camino?
El precedente legal que podría redefinir los derechos de autor en la era digital
El acuerdo de 1,500 millones de dólares al que llegó Anthropic no solo cerró un capítulo judicial, sino que sentó un peligroso precedente para la industria tecnológica. Aunque la empresa se amparó en la *doctrina de la primera venta* —que permite usar copias físicas adquiridas legalmente—, los tribunales determinaron que su escalabilidad industrial y el fin comercial del proyecto la situaban en un área gris. Según analistas de propiedad intelectual, este fallo podría interpretarse como una extensión implícita de los derechos de autor sobre el uso masivo de obras, incluso cuando se poseen físicamente.
El caso expuso una falla crítica en las leyes actuales: fueron diseñadas para regular el consumo individual, no la extracción sistemática de datos por parte de corporaciones. Empresas como Google ya enfrentaron demandas similares en el pasado (como el caso *Authors Guild v. Google* por el escaneo de libros en 2013), pero el Proyecto Panamá llevó el conflicto a un nuevo nivel. A diferencia de Google, que digitalizaba obras para preservarlas, Anthropic las destruía con un propósito exclusivo: alimentar un modelo de IA. Esto obligó a los jueces a considerar si el derecho a poseer un libro incluye el derecho a aniquilarlo para extraer su contenido sin compensar a los creadores.
- Riesgo de efecto dominó: Si otras empresas replican este modelo, los autores podrían verse obligados a demandar caso por caso, un proceso costoso e ineficiente.
- Presión sobre las librerías de segunda mano: Estas podrían convertirse en «proveedores involuntarios» de datos para IA, con precios inflados por la demanda corporativa.
- Debate sobre el «valor residual» de los libros: ¿Debería existir un mecanismo para que los autores reciban regalías incluso cuando sus obras se compran usadas y se destruyen?
Hacia un mercado negro de conocimiento
El Proyecto Panamá reveló algo más que una estrategia legalmente cuestionable: la desesperación de la industria por datos de calidad. Con internet saturado de contenido generado por IA y redes sociales, las empresas buscan fuentes «puras» —como libros editados— para mejorar sus modelos. Pero si el marco legal no se adapta, podríamos ver surgir un mercado paralelo donde las obras se compren y destruyan en masa, eludiendo cualquier compensación a los creadores. La pregunta ya no es si esto es ético, sino qué pasará cuando la demanda de «combustible cultural» supere la oferta de libros físicos disponibles.








