Report 3197

SAN FRANCISCO – Un bufete de abogados con sede en California está iniciando una demanda colectiva contra OpenAI, alegando que la empresa de inteligencia artificial que creó el popular chatbot ChatGPT violó masivamente los derechos de autor y la privacidad de innumerables personas cuando usó datos extraídos de Internet para capacitar a su tecnología.

La demanda busca probar una teoría legal novedosa: que OpenAI violó los derechos de millones de usuarios de Internet cuando usó sus comentarios en las redes sociales, publicaciones de blogs, artículos de Wikipedia y recetas familiares. Clarkson, el bufete de abogados detrás de la demanda, ha presentado previamente demandas colectivas a gran escala sobre temas que van desde violaciones de datos hasta publicidad engañosa.

La firma quiere representar a "personas reales cuya información fue robada y malversada comercialmente para crear esta tecnología tan poderosa", dijo Ryan Clarkson, socio gerente de la firma.

El caso fue presentado en la corte federal en el distrito norte de California el miércoles por la mañana. Un portavoz de OpenAI no respondió a una solicitud de comentarios.

La demanda va al corazón de una importante pregunta sin resolver que se cierne sobre el aumento de las herramientas de inteligencia artificial "generativas", como los chatbots y [generadores de imágenes] (https://www.washingtonpost.com/technology/2023/03/30/midjourney- ai-imagen-generación-reglas/). La tecnología funciona al ingerir miles de millones de palabras de Internet abierto y aprender a construir inferencias entre ellas. Después de consumir suficientes datos, los "modelos de lenguaje grandes" resultantes pueden predecir qué decir en respuesta a un aviso, lo que les da la capacidad de escribir poesía, tener conversaciones complejas y aprobar exámenes profesionales. Pero los humanos que escribieron esos miles de millones de palabras nunca aceptaron que una empresa como OpenAI las usara para su propio beneficio.

"Toda esa información se está tomando a escala cuando nunca tuvo la intención de ser utilizada por un modelo de lenguaje grande", dijo Clarkson. Dijo que espera que un tribunal establezca algunas medidas de seguridad sobre cómo se entrenan los algoritmos de IA y cómo se compensa a las personas cuando se utilizan sus datos.

La firma ya tiene un grupo de demandantes y está buscando activamente más.

La legalidad del uso de datos extraídos de la Internet pública para entrenar herramientas que podrían resultar muy lucrativas para sus desarrolladores aún no está clara. Algunos desarrolladores de IA han argumentado que el uso de datos de Internet debe considerarse "uso justo", un concepto en la ley de derechos de autor que crea una excepción si el material se cambia de una manera "transformadora".

La cuestión del uso justo es "un tema abierto que veremos en los tribunales en los próximos meses y años", dijo Katherine Gardner, abogada de propiedad intelectual en Gunderson Dettmer, una firma que representa principalmente empresas emergentes de tecnología. UPS. Los artistas y otros profesionales creativos que pueden mostrar que su trabajo protegido por derechos de autor se usó para entrenar los modelos de IA podrían tener un argumento en contra de las empresas que lo usan, pero es menos probable que las personas que simplemente publicaron o comentaron en un sitio web puedan ganar daños, dijo. dicho.

"Cuando pones contenido en un sitio de redes sociales o en cualquier sitio, por lo general estás otorgando una licencia muy amplia al sitio para poder usar tu contenido de cualquier forma", dijo Gardner. "Va a ser muy difícil para el usuario final común afirmar que tiene derecho a algún tipo de pago o compensación por el uso de sus datos como parte de la capacitación".

La demanda también se suma a la creciente lista de desafíos legales para las empresas que construyen y esperan beneficiarse de la tecnología de IA. En noviembre se presentó una demanda colectiva contra OpenAI y Microsoft por cómo las empresas usaron código informático en la [plataforma de codificación GitHub] en línea propiedad de Microsoft (https://www.washingtonpost.com/news/the-switch/wp/ 2018/06/04/why-microsoft-is-buying-github-in-7-5-billion-deal/) para entrenar herramientas de IA. En febrero, Getty Images demandó a Stability AI, una pequeña empresa emergente de inteligencia artificial, alegando que usó ilegalmente sus fotos para entrenar a su robot generador de imágenes. Y este mes, OpenAI fue demandado por difamación por un locutor de radio en Georgia que dijo que ChatGPT produjo un texto que lo acusaba injustamente de fraude.

OpenAI no es la única empresa que utiliza grandes cantidades de datos extraídos de la Internet abierta para entrenar sus modelos de IA. Google, Facebook, Microsoft y un número creciente de otras empresas están haciendo lo mismo. Pero Clarkson decidió ir tras OpenAI debido a su papel en estimular a sus rivales más grandes para impulsar su propia IA. cuando capturó la imaginación del público con ChatGPT el año pasado, dijo Clarkson.

“Son la compañía que inició esta carrera armamentista de IA”, dijo. "Son el primer objetivo natural".

OpenAI no comparte qué tipo de datos se incluyeron en su último modelo, GPT4, pero se ha demostrado que las versiones anteriores de la tecnología se han digerido (https://www.washingtonpost.com/technology/interactive/2023/ai- chatbot-learning/) Páginas de Wikipedia, artículos de noticias y comentarios en redes sociales. Los chatbots de Google y otras empresas han utilizado conjuntos de datos similares.

Los reguladores están discutiendo la promulgación de nuevas leyes que requieran más transparencia de las empresas sobre qué datos ingresaron en su IA. También es posible que un caso judicial lleve a un juez a obligar a una empresa como OpenAI a entregar información sobre qué datos usó, dijo Gardner, el abogado de propiedad intelectual.

Algunas empresas han tratado de evitar que las empresas de inteligencia artificial raspen sus datos. En abril, distribuidor de música Universal Music Group pidió a Apple y Spotify que bloquearan los raspadores, según Financial Veces. El sitio de redes sociales Reddit está cerrando el acceso a su flujo de datos, citando cómo las grandes empresas tecnológicas han recopilado durante años los comentarios y las conversaciones en su sitio. El propietario de Twitter, Elon Musk, amenazó con demandar Microsoft por usar datos de Twitter que había obtenido de la empresa para entrenar su IA. Musk está construyendo su propia empresa de IA.

La nueva demanda colectiva contra OpenAI va más allá en sus alegatos, argumentando que la empresa no es lo suficientemente transparente con las personas que se registran para usar sus herramientas como para que los datos que ingresan en el modelo puedan usarse para entrenar nuevos productos que la empresa ganará dinero, como su herramienta de complementos. También alega que OpenAI no hace lo suficiente para asegurarse de que los niños menores de 13 años no utilicen sus herramientas, algo de lo que otras empresas tecnológicas, incluidas Facebook y YouTube, han sido [acusadas a lo largo de los años] (https://www.washingtonpost.com) /tecnología/2021/09/30/facebook-instagram-adolescentes-salud/).

Problema 3197

Incidentes Asociados

Incidente 5613 Reportes
OpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent

El fabricante de ChatGPT, OpenAI, enfrenta una demanda por cómo usó los datos de las personas

Problema 3197

Incidentes Asociados

Incidente 5613 ReportesOpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent

El fabricante de ChatGPT, OpenAI, enfrenta una demanda por cómo usó los datos de las personas

Incidente 5613 Reportes
OpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent