Incident 997: Meta et OpenAI accusés d'utiliser des livres piratés de LibGen pour former des modèles d'IA

Description:

Des documents judiciaires révèlent que des employés de Meta auraient discuté du piratage de livres pour entraîner LLaMA 3, invoquant des problèmes de coût et de rapidité liés aux licences. Des messages internes suggèrent que Meta a accédé à LibGen, un dépôt de plus de 7,5 millions de livres piratés, avec l'approbation apparente de Mark Zuckerberg. Des employés auraient pris des mesures pour masquer l'origine de l'ensemble de données. OpenAI a également été impliqué dans l'utilisation de LibGen.

Editor Notes: Please refer to these two legal filings for more information; the incident date of 02/28/2023 is drawn from (2): (1) Case 3:23-cv-03417-VC, Document 417-6, filed 02/05/2025, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf; and (2) Case 3:23-cv-03417-VC, Document 449-4, filed 02/20/2025, Woodhouse Exhibit 4, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf. See also Incidents 995 and especially 996 for similarly related cases.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Présumé : Un système d'IA développé et mis en œuvre par OpenAI , Meta , OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 et BitTorrent, a endommagé Writers , publishers , Journalists , Authors et Academic researchers.

Systèmes d'IA présumés impliqués: OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 et BitTorrent

Statistiques d'incidents

997

Nombre de rapports

Date de l'incident

2023-02-28

Editeurs

Daniel Atherton

Applied Taxonomies

MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information

Risk Domain

Privacy & Security

Entity

Human

Timing

Pre-deployment

Intent

Intentional

Rapports d'incidents

Chronologie du rapport

Meta a secrètement formé son IA sur une base de données de piratage notoire, révèlent des documents judiciaires récemment non expurgés

wired.com

Les documents judiciaires allèguent que le modèle d'IA formé par Meta utilise LibGen

theregister.com

L'ampleur incroyable du problème des livres piratés de l'IA

theatlantic.com

Des auteurs manifestent à Londres contre la méta-IA formée à l'aide d'une « bibliothèque fantôme »

theguardian.com

wired.com · 2025

Traduit par IA

Meta vient de perdre un combat majeur dans sa bataille juridique en cours contre un groupe d'auteurs qui l'attaquait pour violation de droits d'auteur concernant la façon dont elle entraînait ses modèles d'intelligence artificielle. Contre …

theregister.com · 2025

Traduit par IA

Meta aurait téléchargé du contenu provenant d'une source en ligne poursuivie pour violation de droits d'auteur, afin d'entraîner ses modèles d'IA, selon une nouvelle plainte déposée devant le tribunal.

L'accusation figure dans un document […

theatlantic.com · 2025

Traduit par IA

Note de l'éditeur : Cette analyse fait partie de l'enquête de The Atlantic sur l'ensemble de données Library Genesis. Vous pouvez accéder directement à l'outil de recherche ici. Retrouvez l'outil de recherche de The Atlantic pour les textes…

theguardian.com · 2025

Traduit par IA

Des auteurs et autres professionnels de l'édition manifesteront aujourd'hui devant les bureaux londoniens de Meta pour protester contre l'utilisation par l'organisation de livres protégés par le droit d'auteur pour entraîner l'intelligence …

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?