Incident 996: Meta aurait utilisé Books3, un ensemble de données de 191 000 livres piratés, pour entraîner l'IA LLaMA

Description:

Meta et Bloomberg auraient utilisé Books3, un ensemble de données contenant 191 000 livres piratés, pour entraîner leurs modèles d'IA, dont LLaMA et BloombergGPT, sans le consentement des auteurs. Des auteurs comme Sarah Silverman et Michael Chabon ont intenté des poursuites judiciaires pour violation du droit d'auteur. Books3 inclut des œuvres de grands éditeurs comme Penguin Random House et HarperCollins. Meta affirme que ses résultats d'IA ne sont pas « substantiellement similaires » aux livres originaux, mais les contestations judiciaires se poursuivent.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Alleged: Various generative AI developers , Meta , EleutherAI , Bloomberg , The Pile et Shawn Presser developed an AI system deployed by Various generative AI developers , Meta , EleutherAI et Bloomberg, which harmed Zadie Smith , Writers , Verso , Stephen King , Sarah Silverman , Richard Kadrey , Publishers found in Books3 , Penguin Random House , Oxford University Press , Over 170,000 authors found in Books3 , Michael Pollan , Margaret Atwood , Macmillan , HarperCollins , General public , Creative industries , Christopher Golden et Authors.

Systèmes d'IA présumés impliqués: The Pile , LLaMA , hugging face , GPT-J , Books3 , BloombergGPT et Bibliotik

Statistiques d'incidents

996

Nombre de rapports

Date de l'incident

2020-10-25

Editeurs

Daniel Atherton

Applied Taxonomies

MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information

Risk Domain

Privacy & Security

Entity

Human

Timing

Pre-deployment

Intent

Intentional

Rapports d'incidents

Chronologie du rapport

Sarah Silverman poursuit OpenAI et Meta pour violation du droit d'auteur

theverge.com

Révélations : les auteurs dont les livres piratés alimentent l'IA générative

theatlantic.com

L'IA a englouti des millions de livres sans autorisation. Les auteurs ripostent.

washingtonpost.com

theverge.com · 2023

Traduit par IA

La comédienne et auteure Sarah Silverman, ainsi que les auteurs Christopher Golden et Richard Kadrey, poursuivent OpenAI et Meta chacun devant un tribunal de district des États-Unis pour [double réclamation pour violation du droit d'auteur…

theatlantic.com · 2023

Traduit par IA

Mise à jour à 13h40 HE le 25 septembre 2023

Note de la rédaction : Cet article fait partie de la série de The Atlantic consacrée à Books3. Consultez notre base de données consultable Books3 pour trouver des auteurs et des titres spécifiques…

washingtonpost.com · 2025

Traduit par IA

David Baldacci, auteur de thrillers juridiques à succès, a vu son fils demander à ChatGPT d'élaborer une intrigue à la manière d'un roman de David Baldacci. En cinq secondes, a-t-il déclaré aux sénateurs américains lors d'une audition cette…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Incident 996: Meta aurait utilisé Books3, un ensemble de données de 191 000 livres piratés, pour entraîner l'IA LLaMA

Outils

Entités

Statistiques d'incidents

Classifications de taxonomie MIT

Rapports d'incidents

Chronologie du rapport

Sarah Silverman poursuit OpenAI et Meta pour violation du droit d'auteur

Révélations : les auteurs dont les livres piratés alimentent l'IA générative

L'IA a englouti des millions de livres sans autorisation. Les auteurs ripostent.

Sarah Silverman poursuit OpenAI et Meta pour violation du droit d'auteur

Révélations : les auteurs dont les livres piratés alimentent l'IA générative

L'IA a englouti des millions de livres sans autorisation. Les auteurs ripostent.

Variantes

Incidents similaires

Selected by our editors

Meta and OpenAI Accused of Using LibGen’s Pirated Books to Train AI Models

Incidents similaires

Selected by our editors

Meta and OpenAI Accused of Using LibGen’s Pirated Books to Train AI Models