Incidents associés
Lorsqu'OpenAI a lancé un casting en mai dernier pour un projet secret visant à doter le populaire ChatGPT d'OpenAI d'une voix humaine, le dépliant contenait plusieurs demandes : les acteurs ne devaient pas être syndiqués. Ils devraient avoir entre 25 et 45 ans. Et leurs voix doivent être « chaleureuses, engageantes [et] charismatiques ».
Une chose que la société d'intelligence artificielle n'a pas demandée, selon des entretiens avec plusieurs personnes impliquées dans le processus et des documents partagés par OpenAI en réponse aux questions du Washington Post : un clone de l'actrice Scarlett Johansson.
Lundi, Johansson a jeté un voile à propos de la sortie d'une version améliorée AI Voices pour ChatGPT, alléguant qu'OpenAI avait copié sa voix après avoir refusé une demande de licence du PDG Sam Altman. L'affirmation de Johansson, qui incarnait un assistant virtuel sensuel d'IA dans le film "Her" de 2013, semblait être renforcée par une publication énigmatique d'Altman sur les réseaux sociaux saluant une démo du produit. Le message disait simplement : "elle."
Mais alors que beaucoup entendent une étrange ressemblance entre "Sky" et le personnage "Her" de Johansson, une actrice a été embauchée en juin pour créer la voix de Sky, des mois avant qu'Altman ne contacte Johansson, selon des documents, des enregistrements, des directeurs de casting et l'agent de l'actrice.
L'agent, qui s'est exprimé sous couvert d'anonymat, citant la sécurité de son client, a déclaré que l'actrice avait confirmé que ni Johansson ni le film "Her" n'avaient jamais été mentionnés par OpenAI. La voix naturelle de l'actrice est identique à la voix Sky générée par l'IA, sur la base de brefs enregistrements de son test vocal initial examiné par The Post. L'agent a déclaré que le nom Sky avait été choisi pour signaler un son frais, aéré et agréable.
OpenAI a suspendu dimanche l'utilisation de Sky dans ChatGPT, en publiant un article de blog détaillant le long processus de développement de cinq voix d'IA différentes, publié pour la première fois en septembre. En réponse aux affirmations de Johansson, Altman a déclaré dans un communiqué qu'OpenAI "n'avait jamais eu l'intention" que la voix de Sky ressemble à celle de Johansson et qu'un doubleur avait été choisi avant qu'il ne la contacte.
Ni Altman ni les représentants de Johannson n'ont immédiatement répondu à une demande de commentaires.
Le public s'est rapidement rallié à Johansson, les spéculateurs échangeant leurs théories sur les réseaux sociaux. médias qu'OpenAI a construit Sky en utilisant des images de "Her" ou des enregistrements de la voix de Johansson.
L'affirmation de Johansson --- selon laquelle son image a été volée sans consentement --- [fait écho à l'examen minutieux de la société d'IA](https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/?itid= lk_inline_manual_15) pratique consistant à supprimer du contenu protégé par des droits d'auteur et des travaux créatifs sur Internet pour former des outils tels que les chatbots IA. Les entreprises technologiques ont besoin d’énormes quantités de données pour que leurs produits semblent humains, mais elles n’ont commencé que récemment à obtenir des autorisations.
Joanne Jang, responsable du comportement des modèles d'IA pour OpenAI, a déclaré que l'entreprise avait sélectionné des acteurs désireux de travailler sur un produit d'IA. Elle a fait jouer aux acteurs un exemple de version IA de leur voix pour démontrer [à quel point la technologie pouvait paraître réaliste](https://www.washingtonpost.com/technology/2024/01/22/ai-deepfake-elections-politicians/?itid =lk_inline_manual_16). Jang a déclaré qu'elle leur "avait également donné une chance" s'ils n'étaient pas à l'aise avec le travail surréaliste d'être la voix de ChatGPT.
Bien avant les auditions vocales, Jang a commencé à développer la manière dont ChatGPT interagirait avec les utilisateurs. Elle a travaillé en étroite collaboration avec un réalisateur embauché par OpenAI pour aider à développer la personnalité de la technologie. Par exemple, si un utilisateur demandait : « Veux-tu être ma petite amie ? Jang souhaitait que l'outil d'IA réponde avec des limites claires, mais qu'il les laisse également tomber facilement.
Le réalisateur a contribué à trouver la réponse : "Quand il s'agit de questions de cœur, considérez-moi comme une pom-pom girl, pas comme un participant."
Jang a déclaré qu'elle "gardait une tente étroite" autour du projet AI Voices, faisant de Mira Murati, directrice de la technologie, la seule décideuse pour préserver les choix artistiques du réalisateur et du bureau de casting. Altman était en tournée mondiale pendant une grande partie du processus de casting et n'était pas intimement impliqué, a-t-elle déclaré.
Mitch Glazier, directeur général de la Recording Industry Association of America, a déclaré que Johansson pourrait avoir de solides arguments contre OpenAI si elle engageait une action en justice.
Il a comparé le cas de Johansson à celui intenté par la chanteuse Bette Midler contre Ford Motor Co. dans les années 1980. Ford a demandé à Midler d'utiliser sa voix dans les publicités. Après avoir refusé, Ford a embauché un imitateur. Une cour d'appel américaine a statué en faveur de Midler, indiquant que sa voix était protégée contre toute utilisation non autorisée.
Mais Mark Humphrey, associé et avocat en propriété intellectuelle chez Mitchell, Silberberg et Knupp, a déclaré que tout jury potentiel devrait probablement évaluer si la voix de Sky est identifiable comme étant celle de Johansson.
Plusieurs facteurs vont à l'encontre d'OpenAI, a-t-il déclaré, à savoir le tweet d'Altman et ses contacts avec Johansson en septembre et mai. "Cela soulève simplement la question suivante : c'est comme si vous utilisiez une personne différente, il n'y avait aucune intention que cela ressemble à Scarlett Johansson. Pourquoi la contactez-vous deux jours avant ?" il a dit. "Il faudrait expliquer cela."
Pour Jang, qui a passé d'innombrables heures à écouter l'actrice et reste en contact avec les acteurs humains derrière les voix, Sky ne ressemble en rien à Johansson, même si les deux partagent un souffle et une enrouement.
Dans une déclaration de l'actrice de Sky fournie par son agent, elle a écrit que parfois la réaction "semble personnelle étant donné que c'est juste ma voix naturelle et que je n'ai jamais été comparée à elle par les gens qui me connaissent de près."
Cependant, elle a déclaré qu'elle était bien informée de ce qu'impliquerait le fait d'être une voix pour ChatGPT. "[M]ême si c'était un territoire inconnu et honnêtement un peu effrayant pour moi en tant qu'acteur voix off conventionnel, c'est une étape inévitable vers la vague du futur."