Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Incidente 997: Meta and OpenAI Accused of Using LibGen’s Pirated Books to Train AI Models

Descripción: Court records reveal that Meta employees allegedly discussed pirating books to train LLaMA 3, citing cost and speed concerns with licensing. Internal messages suggest Meta accessed LibGen, a repository of over 7.5 million pirated books, with apparent approval from Mark Zuckerberg. Employees allegedly took steps to obscure the dataset’s origins. OpenAI has also been implicated in using LibGen.
Editor Notes: Please refer to these two legal filings for more information; the incident date of 02/28/2023 is drawn from (2): (1) Case 3:23-cv-03417-VC, Document 417-6, filed 02/05/2025, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf; and (2) Case 3:23-cv-03417-VC, Document 449-4, filed 02/20/2025, Woodhouse Exhibit 4, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf. See also Incidents 995 and especially 996 for similarly related cases.

Herramientas

Nuevo InformeNuevo InformeNueva RespuestaNueva RespuestaDescubrirDescubrirVer HistorialVer Historial

Entidades

Ver todas las entidades
Presunto: un sistema de IA desarrollado e implementado por OpenAI , Meta , OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 y BitTorrent, perjudicó a Writers , publishers , Journalists , Authors y Academic researchers.
Sistemas de IA presuntamente implicados: OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 y BitTorrent

Estadísticas de incidentes

ID
997
Cantidad de informes
4
Fecha del Incidente
2023-02-28
Editores
Daniel Atherton

Informes del Incidente

Cronología de Informes

Incident Occurrence+1
Meta entrenó en secreto su IA con una conocida base de datos de piratería, según revelan documentos judiciales recientemente no redactados.
+1
La increíble magnitud del problema de los libros pirateados por IA
Meta entrenó en secreto su IA con una conocida base de datos de piratería, según revelan documentos judiciales recientemente no redactados.

Meta entrenó en secreto su IA con una conocida base de datos de piratería, según revelan documentos judiciales recientemente no redactados.

wired.com

Los documentos judiciales alegan que Meta entrenó un modelo de IA utilizando LibGen

Los documentos judiciales alegan que Meta entrenó un modelo de IA utilizando LibGen

theregister.com

La increíble magnitud del problema de los libros pirateados por IA

La increíble magnitud del problema de los libros pirateados por IA

theatlantic.com

Autores protestarán en Londres contra la IA de Meta entrenada con una "biblioteca en la sombra"

Autores protestarán en Londres contra la IA de Meta entrenada con una "biblioteca en la sombra"

theguardian.com

Meta entrenó en secreto su IA con una conocida base de datos de piratería, según revelan documentos judiciales recientemente no redactados.
wired.com · 2025
Traducido por IA

Meta acaba de perder una importante batalla legal en curso contra un grupo de autores que la demandaron por violación de derechos de autor debido a la forma en que entrenó sus modelos de inteligencia artificial. En contra de la voluntad de …

Los documentos judiciales alegan que Meta entrenó un modelo de IA utilizando LibGen
theregister.com · 2025
Traducido por IA

Meta presuntamente descargó material de una fuente en línea demandada por violación de derechos de autor, ya que quería dicho material para entrenar sus modelos de IA, según un nuevo expediente judicial.

La acusación se presentó en un docum…

La increíble magnitud del problema de los libros pirateados por IA
theatlantic.com · 2025
Traducido por IA

Nota del editor: Este análisis forma parte de la investigación de The Atlantic sobre el conjunto de datos Library Genesis. Puede acceder directamente a la herramienta de búsqueda [aquí] (https://www.theatlantic.com/technology/archive/2025/0…

Autores protestarán en Londres contra la IA de Meta entrenada con una "biblioteca en la sombra"
theguardian.com · 2025
Traducido por IA

Autores y otros profesionales de la industria editorial se manifestarán hoy frente a la oficina de Meta en Londres para protestar por el uso de libros con derechos de autor por parte de la organización para entrenar inteligencia artificial.…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Selected by our editors

New York Times sues OpenAI, Microsoft for using articles to train AI

Dec 2023 · 2 informes

Revealed: The Authors Whose Pirated Books Are Powering Generative AI

Oct 2020 · 2 informes
Incidente AnteriorSiguiente Incidente

Incidentes Similares

Selected by our editors

New York Times sues OpenAI, Microsoft for using articles to train AI

Dec 2023 · 2 informes

Revealed: The Authors Whose Pirated Books Are Powering Generative AI

Oct 2020 · 2 informes

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • 1420c8e