Incidents associés
Le New York Times a poursuivi OpenAI et Microsoft mercredi pour l'utilisation par ces entreprises technologiques de ses articles protégés par le droit d'auteur afin d'entraîner leur technologie d'intelligence artificielle. Il s'inscrit ainsi dans une vague croissante d'opposition à l'utilisation par l'industrie technologique de créations sans contrepartie financière ni autorisation.
OpenAI et Microsoft ont utilisé des « millions » d'articles du Times pour développer leur technologie, aujourd'hui extrêmement lucrative et en concurrence directe avec les services du Times, ont écrit les avocats du journal dans une plainte déposée devant un tribunal fédéral de Manhattan.
« Depuis des mois, le Times tente de parvenir à un accord négocié », ont déclaré les avocats du Times dans la plainte. « … Ces négociations n'ont pas abouti. »
OpenAI a déclaré respecter les droits des créateurs et propriétaires de contenu et s'engager à collaborer avec eux « afin qu'ils bénéficient de la technologie de l'IA et des nouveaux modèles de revenus », a déclaré sa porte-parole Lindsey Held. « Nos échanges continus avec le New York Times ont été productifs et progressent de manière constructive. Nous sommes donc surpris et déçus par cette évolution. »
Les « grands modèles linguistiques » (LLM) qui sous-tendent des outils d'IA tels que ChatGPT fonctionnent en ingérant d'énormes quantités de texte extraites d'Internet, en apprenant les liens entre les mots et les concepts, puis en développant la capacité de prédire le mot suivant dans une phrase, ce qui leur permet d'imiter le langage et l'écriture humains. OpenAI, Microsoft et Google ont refusé de révéler le contenu de leurs nouveaux modèles, mais il a été démontré que les LLM précédents incluaient de grandes quantités de contenu provenant d'organismes de presse et de catalogues de livres.
Les entreprises technologiques ont fermement affirmé que l'utilisation d'informations extraites d'Internet pour entraîner leurs algorithmes d'IA relevait de l'« usage équitable », un concept du droit d'auteur qui permet d'utiliser l'œuvre d'autrui si elle est substantiellement modifiée. La plainte du Times, cependant, inclut de nombreux exemples de reproduction textuelle d'articles du New York Times par le modèle d'IA GPT-4 d'OpenAI.
Des experts juridiques ont déclaré que les plaignants auront des arguments plus solides en matière de violation du droit d'auteur s'ils peuvent démontrer que les outils d'IA reproduisent directement les œuvres protégées, plutôt que de paraphraser les informations qu'ils contiennent.
Résistance
Le secteur de l'information est confronté à une problématique complexe quant à sa relation avec cette technologie en évolution rapide. Plusieurs entreprises de médias ont entamé des discussions internes sur l'utilisation des nouveaux outils automatisés pour faciliter la collecte et la production d'informations. Certains, comme Sports Illustrated, ont subi des critiques négatives pour avoir utilisé l'IA afin de générer des articles d'actualité présentés comme rédigés par des humains.
D'autres éditeurs en ligne ont déjà commencé à utiliser l'IA pour produire d'énormes quantités de nouveaux contenus dans le but de capter le trafic des moteurs de recherche Google et d'augmenter leurs revenus publicitaires. Parmi eux figurent les sites de fake news qui publient de fausses informations. Depuis mai, le nombre de sites web affichant de faux articles rédigés par l'IA a bondi de plus de 1 000 %, selon NewsGuard, une organisation qui traque la désinformation.
Mais l'utilisation de cette technologie représente également une possible crise existentielle pour le secteur de l'information, qui peine à trouver des moyens de remplacer les revenus qu'il générait autrefois grâce à ses publications imprimées rentables. Selon le Pew Research Center, le nombre de journalistes travaillant dans les salles de rédaction a diminué de plus de 25 % entre 2008 et 2020.
En poursuivant OpenAI et Microsoft, le Times rejoint un groupe croissant d'artistes, d'auteurs, de musiciens, de cinéastes et d'autres professionnels de la création qui réclament reconnaissance et compensation de la part des entreprises technologiques qui ont utilisé leur travail pour créer des outils qui, selon eux, nuisent déjà à leur travail*.*
Certains d'entre eux, dont des auteurs de films à succès comme George R.R. Martin, Jodi Picoult, Jonathan Franzen et George Saunders, ont également poursuivi OpenAI en justice*. Depuis août, au moins 583 organes de presse, dont le Times, le Washington Post et Reuters, ont installé des bloqueurs sur leurs sites web pour empêcher les entreprises technologiques de récupérer leurs articles. Mais leurs catalogues en ligne, datant de plusieurs décennies, ont probablement déjà été utilisés pour créer des outils d'IA.
« Nous examinons attentivement la plainte du New York Times et soutenons sa décision de protéger ces importants principes de droit d'auteur », a déclaré mercredi un porte-parole du Post.
Par ailleurs, OpenAI a négocié des accords avec des organes de presse au cours de l'année écoulée afin de les rémunérer pour leurs contenus. En juillet, OpenAI a signé un accord avec l'Associated Press pour l'accès à ses archives d'articles de presse. Mais en octobre, un porte-parole d'OpenAI a déclaré que les pratiques de l'entreprise ne violaient pas les lois sur le droit d'auteur et que les accords négociés ne permettraient que l'accès à du contenu inaccessible en ligne ou l'affichage de liens ou de sections complètes d'articles dans ChatGPT.
L'éditeur allemand Axel Springer, propriétaire de Politico et de Business Insider, a également signé un accord avec OpenAI au début du mois, aux termes duquel l'entreprise technologique paiera pour afficher des extraits d'articles dans les réponses ChatGPT. Et plus tôt cette année, Google a proposé aux médias de créer et de vendre des outils d’IA qui pourraient aider les journalistes.