Description: Court records reveal that Meta employees allegedly discussed pirating books to train LLaMA 3, citing cost and speed concerns with licensing. Internal messages suggest Meta accessed LibGen, a repository of over 7.5 million pirated books, with apparent approval from Mark Zuckerberg. Employees allegedly took steps to obscure the dataset’s origins. OpenAI has also been implicated in using LibGen.
Editor Notes: Please refer to these two legal filings for more information; the incident date of 02/28/2023 is drawn from (2): (1) Case 3:23-cv-03417-VC, Document 417-6, filed 02/05/2025, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf; and (2) Case 3:23-cv-03417-VC, Document 449-4, filed 02/20/2025, Woodhouse Exhibit 4, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf. See also Incidents 995 and especially 996 for similarly related cases.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por OpenAI , Meta , OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 y BitTorrent, perjudicó a Writers , publishers , Journalists , Authors y Academic researchers.
Sistemas de IA presuntamente implicados: OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 y BitTorrent
Estadísticas de incidentes
ID
997
Cantidad de informes
3
Fecha del Incidente
2023-02-28
Editores
Daniel Atherton
Informes del Incidente
Cronología de Informes

Meta acaba de perder una importante batalla legal en curso contra un grupo de autores que la demandaron por violación de derechos de autor debido a la forma en que entrenó sus modelos de inteligencia artificial. En contra de la voluntad de …

Meta presuntamente descargó material de una fuente en línea demandada por violación de derechos de autor, ya que quería dicho material para entrenar sus modelos de IA, según un nuevo expediente judicial.
La acusación se presentó en un docum…
Nota del editor: Este análisis forma parte de la investigación de The Atlantic sobre el conjunto de datos Library Genesis. Puede acceder directamente a la herramienta de búsqueda [aquí] (https://www.theatlantic.com/technology/archive/2025/0…
Variantes
Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.