Report 3197

SAN FRANCISCO - Un cabinet d'avocats basé en Californie lance un recours collectif contre OpenAI, alléguant que la société d'intelligence artificielle qui a créé le populaire chatbot ChatGPT a massivement violé les droits d'auteur et la vie privée d'innombrables personnes lorsqu'elle a utilisé des données récupérées sur Internet pour former sa technologie.

Le procès vise à tester une nouvelle théorie juridique - qu'OpenAI a violé les droits de millions d'internautes lorsqu'il a utilisé leurs commentaires sur les réseaux sociaux, leurs blogs, leurs articles sur Wikipédia et leurs recettes familiales. Clarkson, le cabinet d'avocats à l'origine de la poursuite, a déjà intenté des recours collectifs à grande échelle sur des questions allant des violations de données à la publicité mensongère.

L'entreprise veut représenter "de vraies personnes dont les informations ont été volées et détournées commercialement pour créer cette technologie très puissante", a déclaré Ryan Clarkson, associé directeur de l'entreprise.

L'affaire a été déposée devant un tribunal fédéral du district nord de la Californie mercredi matin. Un porte-parole d'OpenAI n'a pas répondu à une demande de commentaire.

Le procès va au cœur d'une question majeure non résolue qui pèse sur l'essor des outils d'IA "génératifs" tels que les chatbots et [les générateurs d'images](https://www.washingtonpost.com/technology/2023/03/30/midjourney- ai-image-génération-règles/). La technologie fonctionne en ingérant des milliards de mots à partir d'Internet ouvert et en apprenant à établir des inférences entre eux. Après avoir consommé suffisamment de données, les "grands modèles linguistiques" résultants peuvent prédire quoi dire en réponse à une invite, leur donnant la possibilité d'écrire de la poésie, d'avoir des conversations complexes et de passer des examens professionnels. Mais les humains qui ont écrit ces milliards de mots n'ont jamais accepté qu'une entreprise comme OpenAI les utilise à son propre profit.

"Toutes ces informations sont prises à grande échelle alors qu'elles n'ont jamais été destinées à être utilisées par un grand modèle de langage", a déclaré Clarkson. Il a déclaré qu'il espérait qu'un tribunal instituerait des garde-fous sur la manière dont les algorithmes d'IA sont formés et sur la manière dont les personnes sont indemnisées lorsque leurs données sont utilisées.

Le cabinet a déjà un groupe de plaignants et en recherche activement d'autres.

La légalité de l'utilisation de données extraites de l'Internet public pour former des outils qui pourraient s'avérer très lucratifs pour leurs développeurs n'est toujours pas claire. Certains développeurs d'IA ont fait valoir que l'utilisation de données provenant d'Internet devrait être considérée comme une "utilisation équitable", un concept de la loi sur le droit d'auteur qui crée une exception si le matériel est modifié de manière "transformatrice".

La question de l'utilisation équitable est "une question ouverte que nous verrons se jouer devant les tribunaux dans les mois et les années à venir", a déclaré Katherine Gardner, avocate en propriété intellectuelle chez Gunderson Dettmer, un cabinet qui représente principalement la start-up technologique. UPS. Les artistes et autres professionnels de la création qui peuvent montrer que leur travail protégé par le droit d'auteur a été utilisé pour former les modèles d'IA pourraient avoir un argument contre les entreprises qui l'utilisent, mais il est moins probable que les personnes qui ont simplement publié ou commenté sur un site Web puissent obtenir des dommages-intérêts, elle a dit.

"Lorsque vous mettez du contenu sur un site de médias sociaux ou sur n'importe quel site, vous accordez généralement une licence très large au site pour pouvoir utiliser votre contenu de quelque manière que ce soit", a déclaré Gardner. "Il va être très difficile pour l'utilisateur final ordinaire de prétendre qu'il a droit à une quelconque forme de paiement ou de compensation pour l'utilisation de ses données dans le cadre de la formation."

La poursuite s'ajoute également à la liste croissante des défis juridiques auxquels sont confrontées les entreprises qui construisent et espèrent tirer profit de la technologie de l'IA. Un recours collectif a été déposé en novembre contre OpenAI et Microsoft pour la façon dont les entreprises ont utilisé du code informatique dans la [plate-forme de codage GitHub] en ligne appartenant à Microsoft (https://www.washingtonpost.com/news/the-switch/wp/ 2018/06/04/why-microsoft-is-buying-github-in-7-5-billion-deal/) pour former des outils d'IA. En février, Getty Images a poursuivi Stability AI, une petite start-up d'IA, alléguant qu'elle utilisait illégalement ses photos pour entraîner son robot générateur d'images. Et ce mois-ci, OpenAI a été poursuivi pour diffamation par un animateur de radio en Géorgie qui a déclaré que ChatGPT avait produit un texte l'accusant à tort de fraude.

OpenAI n'est pas la seule entreprise à utiliser des trésors de données récupérées sur Internet pour former ses modèles d'IA. Google, Facebook, Microsoft et un nombre croissant d'autres entreprises font tous la même chose. Mais Clarkson a décidé de poursuivre OpenAI en raison de son rôle dans la stimulation de ses plus grands rivaux pour déployer sa propre IA quand il a capturé l'imagination du public avec ChatGPT l'année dernière, a déclaré Clarkson.

"C'est l'entreprise qui a déclenché cette course aux armements contre l'IA", a-t-il déclaré. "Ils sont la première cible naturelle."

OpenAI ne partage pas le type de données entrées dans son dernier modèle, GPT4, mais les versions précédentes de la technologie ont été [montrées comme ayant été digérées](https://www.washingtonpost.com/technology/interactive/2023/ai- chatbot-learning/) Pages Wikipédia, articles de presse et commentaires sur les réseaux sociaux. Les chatbots de Google et d'autres sociétés ont utilisé des ensembles de données similaires.

Les régulateurs discutent de la promulgation de nouvelles lois qui exigent plus de transparence de la part des entreprises sur les données entrées dans leur IA. Il est également possible qu'une affaire judiciaire incite un juge à forcer une entreprise comme OpenAI à fournir des informations sur les données qu'elle a utilisées, a déclaré Gardner, l'avocat spécialisé en propriété intellectuelle.

Certaines entreprises ont tenté d'empêcher les entreprises d'IA de supprimer leurs données. En avril, distributeur de musique Universal Music Group a demandé à Apple et Spotify de bloquer les scrapers, selon le Financial Fois. Le site de médias sociaux Reddit ferme l'accès à son flux de données, citant la façon dont les entreprises Big Tech ont pendant des années gratté les commentaires et les conversations sur son site. Le propriétaire de Twitter, Elon Musk menacé de poursuivre Microsoft pour avoir utilisé les données Twitter qu'il avait obtenues de l'entreprise pour former son IA. Musk est en train de construire sa propre entreprise d'IA.

Le nouveau recours collectif contre OpenAI va plus loin dans ses allégations, arguant que l'entreprise n'est pas assez transparente avec les personnes qui s'inscrivent pour utiliser ses outils que les données qu'elles mettent dans le modèle peuvent être utilisées pour former de nouveaux produits que l'entreprise va gagner de l'argent, comme son outil Plugins. Il allègue également qu'OpenAI ne fait pas assez pour s'assurer que les enfants de moins de 13 ans n'utilisent pas ses outils, ce que d'autres entreprises technologiques, dont Facebook et YouTube, ont été [accusé au fil des ans](https://www.washingtonpost.com /technologie/2021/09/30/facebook-instagram-teens-health/).

Problème 3197

Incidents associés

Incident 5613 Rapports
OpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent

Le fabricant de ChatGPT, OpenAI, fait face à un procès pour la façon dont il a utilisé les données des personnes

Problème 3197

Incidents associés

Incident 5613 RapportsOpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent

Le fabricant de ChatGPT, OpenAI, fait face à un procès pour la façon dont il a utilisé les données des personnes

Incident 5613 Rapports
OpenAI Alleged by Lawsuit Violated Users' Privacy Rights by Training AI on Private Info without Informed Consent