Report 3226

La comediante y autora Sarah Silverman, así como los autores Christopher Golden y Richard Kadrey, están demandando a OpenAI y Meta cada uno en un tribunal de distrito de EE. UU. sobre [reclamaciones duales de infracción de derechos de autor](https://llmlitigation. es/).

Las demandas alegan, entre otras cosas, que ChatGPT de OpenAI y LLaMA de Meta fueron entrenados en conjuntos de datos adquiridos ilegalmente que contienen sus trabajos, que, según dicen, fueron adquiridos de sitios web de "bibliotecas en la sombra" como Bibliotik, Library Genesis, Z-Library y otros, señalando los libros están "disponibles al por mayor a través de sistemas torrent".

Golden y Kadrey se negaron a comentar sobre la demanda, mientras que el equipo de Silverman no respondió al cierre de esta edición.

En la demanda de OpenAI, el trío ofrece pruebas que muestra que, cuando se le solicite, ChatGPT resumirá sus libros. , infringiendo sus derechos de autor. Bedwetter de Silverman es el primer libro que ChatGPT muestra resumido en las exhibiciones, mientras que el libro de Golden Ararat también se utiliza como ejemplo, al igual que el libro de Kadrey Sandman Slim. El reclamo dice que el chatbot nunca se molestó en "reproducir ninguna información de gestión de derechos de autor que los demandantes incluyeron con sus trabajos publicados".

En cuanto a la demanda separada contra Meta, alega que los libros de los autores eran accesibles en los conjuntos de datos que Meta usó para entrenar sus modelos LLaMA, un cuarteto de modelos de IA de código abierto la empresa presentó en febrero.

La demanda expone en pasos por qué los demandantes creen que los conjuntos de datos tienen orígenes ilícitos: en un Meta paper que detalla LLaMA, la compañía señala las fuentes de sus conjuntos de datos de capacitación, uno de los cuales se llama ThePile, que fue ensamblado por una empresa llamada EleutherAI. ThePile, señala la denuncia, fue descrito en un [artículo de EleutherAI] (https://arxiv.org/abs/2101.00027) como elaborado a partir de “una copia del contenido del rastreador privado Bibliotik”. Bibliotik y las otras “bibliotecas en la sombra” enumeradas, dice la demanda, son “flagrantemente ilegales”.

En ambas afirmaciones, los autores dicen que “no dieron su consentimiento para el uso de sus libros protegidos por derechos de autor como material de capacitación” para los modelos de IA de las empresas. Cada una de sus demandas contiene seis cargos de varios tipos de violaciones de derechos de autor, negligencia, enriquecimiento injusto y competencia desleal. Los autores buscan daños legales, restitución de ganancias y más.

Los abogados Joseph Saveri y Matthew Butterick, que representan a los tres autores, escriben en su sitio web de LLMlitigation que han escuchado a “escritores, autores y editores preocupados por [ La asombrosa capacidad de ChatGPT para generar texto similar al que se encuentra en materiales textuales protegidos por derechos de autor, incluidos miles de libros”.

Saveri también ha iniciado un litigio contra empresas de inteligencia artificial en nombre de [programadores] (https://www.theverge.com/2023/1/28/23575919/microsoft-openai-github-dismiss-copilot-ai-copyright-lawsuit) y [artistas] (https://www.theverge.com/2023/1/16/23557098/generative-ai-art-copyright-legal-lawsuit-stable-diffusion-midjourney-deviantart). Getty Images también presentó una demanda sobre IA, alegando que Stability AI, quien creó la herramienta de generación de imágenes de IA Stable Diffusion, entrenó su modelo en "millones de imágenes protegidas por derechos de autor". Saveri y Butterick también representan a los autores Mona Awad y Paul Tremblay [en un caso similar](https://www.theguardian.com/books/2023/jul/05/authors-file-a-lawsuit-against-openai-for -ingerir-ilegalmente-sus-libros) a través del chatbot de la empresa.

Demandas como ésta no son sólo un dolor de cabeza para OpenAI y otras empresas de IA; están [desafiando los límites mismos de los derechos de autor] (https://www.theverge.com/23444685/generative-ai-copyright-infringement-legal-fair-use-training-data). Como dijimos en The Vergecast cada vez que alguien pone a Nilay en contacto con la ley de derechos de autor, veremos demandas centradas en este tema durante [los próximos años](https://www.theverge.com/2023/4/ 1/23666153/el-dilema-de-derechos-de-autor-de-ai-es-probablemente-una-década-de-demandas-por-venir).

Nos comunicamos con Meta, OpenAI y el bufete de abogados Joseph Saveri para solicitar comentarios, pero no respondieron al cierre de esta edición.

Problema 3226

Incidentes Asociados

Incidente 9963 Reportes
Meta Allegedly Used Books3, a Dataset of 191,000 Pirated Books, to Train LLaMA AI

Sarah Silverman demanda a OpenAI y Meta por infracción de derechos de autor

Problema 3226

Incidentes Asociados

Incidente 9963 ReportesMeta Allegedly Used Books3, a Dataset of 191,000 Pirated Books, to Train LLaMA AI

Sarah Silverman demanda a OpenAI y Meta por infracción de derechos de autor

Incidente 9963 Reportes
Meta Allegedly Used Books3, a Dataset of 191,000 Pirated Books, to Train LLaMA AI