Incidente 996: Meta supuestamente utilizó Books3, un conjunto de datos de 191.000 libros pirateados, para entrenar la inteligencia artificial de LLaMA
Descripción: Meta y Bloomberg presuntamente utilizaron Books3, un conjunto de datos que contiene 191.000 libros pirateados, para entrenar sus modelos de IA, incluyendo LLaMA y BloombergGPT, sin el consentimiento de los autores. Autores como Sarah Silverman y Michael Chabon han presentado demandas que alegan que esto constituye una infracción de derechos de autor. Books3 incluye obras de importantes editoriales como Penguin Random House y HarperCollins. Meta argumenta que sus resultados de IA no son "sustancialmente similares" a los libros originales, pero los recursos legales continúan.
Herramientas
Nuevo InformeNueva RespuestaDescubrirVer Historial
El Monitor de Incidentes y Riesgos de IA de la OCDE (AIM) recopila y clasifica automáticamente incidentes y riesgos relacionados con la IA en tiempo real a partir de fuentes de noticias reputadas en todo el mundo.
Entidades
Ver todas las entidadesAlleged: Various generative AI developers , Meta , EleutherAI , Bloomberg , The Pile y Shawn Presser developed an AI system deployed by Various generative AI developers , Meta , EleutherAI y Bloomberg, which harmed Zadie Smith , Writers , Verso , Stephen King , Sarah Silverman , Richard Kadrey , Publishers found in Books3 , Penguin Random House , Oxford University Press , Over 170,000 authors found in Books3 , Michael Pollan , Margaret Atwood , Macmillan , HarperCollins , General public , Creative industries , Christopher Golden y Authors.
Sistemas de IA presuntamente implicados: The Pile , LLaMA , hugging face , GPT-J , Books3 , BloombergGPT y Bibliotik
Estadísticas de incidentes
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Privacy & Security
Entity
Which, if any, entity is presented as the main cause of the risk
Human
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Pre-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Intentional
Informes del Incidente
Cronología de Informes
Loading...
Loading...
Actualizado a la 1:40 p. m. ET del 25 de septiembre de 2023
Nota del editor: Este artículo forma parte de la serie de The Atlantic sobre Books3. Consulte nuestra base de datos de Books3 con función de búsqueda para encontrar autores y títul…
Loading...
David Baldacci, autor de exitosos thrillers legales, vio cómo su hijo le pedía a ChatGPT que creara una trama al estilo de una novela de David Baldacci. En cinco segundos, según declaró a los senadores estadounidenses en una audiencia esta …
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?