Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Incident 997: Meta and OpenAI Accused of Using LibGen’s Pirated Books to Train AI Models

Description: Court records reveal that Meta employees allegedly discussed pirating books to train LLaMA 3, citing cost and speed concerns with licensing. Internal messages suggest Meta accessed LibGen, a repository of over 7.5 million pirated books, with apparent approval from Mark Zuckerberg. Employees allegedly took steps to obscure the dataset’s origins. OpenAI has also been implicated in using LibGen.
Editor Notes: Please refer to these two legal filings for more information; the incident date of 02/28/2023 is drawn from (2): (1) Case 3:23-cv-03417-VC, Document 417-6, filed 02/05/2025, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf; and (2) Case 3:23-cv-03417-VC, Document 449-4, filed 02/20/2025, Woodhouse Exhibit 4, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf. See also Incidents 995 and especially 996 for similarly related cases.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Présumé : Un système d'IA développé et mis en œuvre par OpenAI , Meta , OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 et BitTorrent, a endommagé Writers , publishers , Journalists , Authors et Academic researchers.
Systèmes d'IA présumés impliqués: OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 et BitTorrent

Statistiques d'incidents

ID
997
Nombre de rapports
4
Date de l'incident
2023-02-28
Editeurs
Daniel Atherton

Rapports d'incidents

Chronologie du rapport

Incident Occurrence+1
Meta a secrètement formé son IA sur une base de données de piratage notoire, révèlent des documents judiciaires récemment non expurgés
+1
L'ampleur incroyable du problème des livres piratés de l'IA
Meta a secrètement formé son IA sur une base de données de piratage notoire, révèlent des documents judiciaires récemment non expurgés

Meta a secrètement formé son IA sur une base de données de piratage notoire, révèlent des documents judiciaires récemment non expurgés

wired.com

Les documents judiciaires allèguent que le modèle d'IA formé par Meta utilise LibGen

Les documents judiciaires allèguent que le modèle d'IA formé par Meta utilise LibGen

theregister.com

L'ampleur incroyable du problème des livres piratés de l'IA

L'ampleur incroyable du problème des livres piratés de l'IA

theatlantic.com

Des auteurs manifestent à Londres contre la méta-IA formée à l'aide d'une « bibliothèque fantôme »

Des auteurs manifestent à Londres contre la méta-IA formée à l'aide d'une « bibliothèque fantôme »

theguardian.com

Meta a secrètement formé son IA sur une base de données de piratage notoire, révèlent des documents judiciaires récemment non expurgés
wired.com · 2025
Traduit par IA

Meta vient de perdre un combat majeur dans sa bataille juridique en cours contre un groupe d'auteurs qui l'attaquait pour violation de droits d'auteur concernant la façon dont elle entraînait ses modèles d'intelligence artificielle. Contre …

Les documents judiciaires allèguent que le modèle d'IA formé par Meta utilise LibGen
theregister.com · 2025
Traduit par IA

Meta aurait téléchargé du contenu provenant d'une source en ligne poursuivie pour violation de droits d'auteur, afin d'entraîner ses modèles d'IA, selon une nouvelle plainte déposée devant le tribunal.

L'accusation figure dans un document […

L'ampleur incroyable du problème des livres piratés de l'IA
theatlantic.com · 2025
Traduit par IA

Note de l'éditeur : Cette analyse fait partie de l'enquête de The Atlantic sur l'ensemble de données Library Genesis. Vous pouvez accéder directement à l'outil de recherche ici. Retrouvez l'outil de recherche de The Atlantic pour les textes…

Des auteurs manifestent à Londres contre la méta-IA formée à l'aide d'une « bibliothèque fantôme »
theguardian.com · 2025
Traduit par IA

Des auteurs et autres professionnels de l'édition manifesteront aujourd'hui devant les bureaux londoniens de Meta pour protester contre l'utilisation par l'organisation de livres protégés par le droit d'auteur pour entraîner l'intelligence …

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.

Incidents similaires

Selected by our editors

New York Times sues OpenAI, Microsoft for using articles to train AI

Dec 2023 · 2 rapports

Revealed: The Authors Whose Pirated Books Are Powering Generative AI

Oct 2020 · 2 rapports
Incident précédentProchain incident

Incidents similaires

Selected by our editors

New York Times sues OpenAI, Microsoft for using articles to train AI

Dec 2023 · 2 rapports

Revealed: The Authors Whose Pirated Books Are Powering Generative AI

Oct 2020 · 2 rapports

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df