Incident 996: Meta aurait utilisé Books3, un ensemble de données de 191 000 livres piratés, pour entraîner l'IA LLaMA
Description: Meta et Bloomberg auraient utilisé Books3, un ensemble de données contenant 191 000 livres piratés, pour entraîner leurs modèles d'IA, dont LLaMA et BloombergGPT, sans le consentement des auteurs. Des auteurs comme Sarah Silverman et Michael Chabon ont intenté des poursuites judiciaires pour violation du droit d'auteur. Books3 inclut des œuvres de grands éditeurs comme Penguin Random House et HarperCollins. Meta affirme que ses résultats d'IA ne sont pas « substantiellement similaires » aux livres originaux, mais les contestations judiciaires se poursuivent.
Entités
Voir toutes les entitésAlleged: Various generative AI developers , Meta , EleutherAI , Bloomberg , The Pile et Shawn Presser developed an AI system deployed by Various generative AI developers , Meta , EleutherAI et Bloomberg, which harmed Zadie Smith , Writers , Verso , Stephen King , Sarah Silverman , Richard Kadrey , Publishers found in Books3 , Penguin Random House , Oxford University Press , Over 170,000 authors found in Books3 , Michael Pollan , Margaret Atwood , Macmillan , HarperCollins , General public , Creative industries , Christopher Golden et Authors.
Systèmes d'IA présumés impliqués: The Pile , LLaMA , hugging face , GPT-J , Books3 , BloombergGPT et Bibliotik
Statistiques d'incidents
ID
996
Nombre de rapports
2
Date de l'incident
2020-10-25
Editeurs
Daniel Atherton
Rapports d'incidents
Chronologie du rapport
/cdn.vox-cdn.com/uploads/chorus_asset/file/24778390/668894138.jpg)
Mise à jour à 13h40 HE le 25 septembre 2023
Note de la rédaction : Cet article fait partie de la série de The Atlantic consacrée à Books3. Consultez notre base de données consultable Books3 pour trouver des auteurs et des titres spécifiques…
Variantes
Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?