Incident 996: Meta aurait utilisé Books3, un ensemble de données de 191 000 livres piratés, pour entraîner l'IA LLaMA
Description: Meta et Bloomberg auraient utilisé Books3, un ensemble de données contenant 191 000 livres piratés, pour entraîner leurs modèles d'IA, dont LLaMA et BloombergGPT, sans le consentement des auteurs. Des auteurs comme Sarah Silverman et Michael Chabon ont intenté des poursuites judiciaires pour violation du droit d'auteur. Books3 inclut des œuvres de grands éditeurs comme Penguin Random House et HarperCollins. Meta affirme que ses résultats d'IA ne sont pas « substantiellement similaires » aux livres originaux, mais les contestations judiciaires se poursuivent.
Outils
Nouveau rapportNouvelle RéponseDécouvrirVoir l'historique
Le Moniteur des incidents et risques liés à l'IA de l'OCDE (AIM) collecte et classe automatiquement les incidents et risques liés à l'IA en temps réel à partir de sources d'information réputées dans le monde entier.
Entités
Voir toutes les entitésAlleged: Meta , EleutherAI , Bloomberg , Generative AI developers , The Pile et Shawn Presser developed an AI system deployed by Meta , EleutherAI , Bloomberg et Generative AI developers, which harmed Zadie Smith , Writers , Verso , Stephen King , Sarah Silverman , Richard Kadrey , Publishers found in Books3 , Penguin Random House , Oxford University Press , Over 170,000 authors found in Books3 , Michael Pollan , Margaret Atwood , Macmillan , HarperCollins , General public , Creative industries , Christopher Golden et Authors.
Systèmes d'IA présumés impliqués: The Pile , LLaMA , hugging face , GPT-J , Books3 , BloombergGPT et Bibliotik
Statistiques d'incidents
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Privacy & Security
Entity
Which, if any, entity is presented as the main cause of the risk
Human
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Pre-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal