Incidents associés

Dans un monde post-Photoshop, la plupart d'entre nous savent que les images ne sont pas toujours fiables. Maintenant, grâce à l'intelligence artificielle, il semble que la vidéo puisse aussi nous mentir.
Des chercheurs de l'Université de Washington ont développé une IA qui peut modifier les séquences vidéo d'une personne qui parle pour que ses lèvres correspondent à différents sons, mettant littéralement des mots dans sa bouche.
Les chercheurs ont formé leur IA à l'aide d'enregistrements vidéo et audio de l'ancien président Barack Obama. Plus précisément, l'IA a tiré des leçons d'environ 14 heures de séquences de haute qualité provenant des vidéos d'adresses hebdomadaires du président diffusées pendant son mandat.
À l'aide d'un réseau neuronal récurrent, l'IA a pu faire correspondre les paroles prononcées par le président avec les formes de bouche qu'il a faites pendant les vidéos. Le programme a ensuite créé des textures de bouche en 3D pour les différents sons et les a mappés sur le visage du président dans d'autres vidéos. L'équipe derrière l'IA a suggéré qu'elle pourrait être utilisée avec des programmes de chat vidéo comme Skype pour améliorer la qualité vidéo sans nécessiter autant de bande passante.
Bien sûr, l'amélioration du chat vidéo n'est pas la seule façon d'utiliser l'IA. Bien que les chercheurs n'aient transplanté que des mots réellement prononcés par le président Obama à un moment donné, leur projet soulève des questions effrayantes sur l'avenir de l'IA.
Avec les récents problèmes avec les fausses nouvelles sur Internet, il n'est pas difficile d'imaginer les implications d'une IA qui peut créer de fausses vidéos de quelqu'un disant presque n'importe quoi. Cependant, les créateurs de l'IA n'ont pas tardé à souligner que leur programme ne fonctionne qu'avec l'audio du haut-parleur réel.
"Vous ne pouvez pas simplement prendre la voix de n'importe qui et la transformer en une vidéo d'Obama", a déclaré Steve Seitz, professeur à l'Université de Washington et l'un des chercheurs à l'origine de la nouvelle IA. «Nous avons très consciemment décidé de ne pas emprunter la voie consistant à mettre les mots des autres dans la bouche de quelqu'un. Nous prenons simplement de vrais mots que quelqu'un a prononcés et les transformons en vidéo réaliste de cet individu.
L'IA peut ne pas fonctionner avec la voix de n'importe qui, mais cela peut ne pas être un problème grâce à certains des programmes vocaux d'IA en cours d'élaboration. Par exemple, le géant chinois du Web Baidu Inc. a créé une IA capable de reproduire des centaines d'accents différents, et il peut le faire en apprenant à partir d'échantillons audio relativement courts. Lorsque la technologie de Baidu ou des projets similaires seront suffisamment avancés, ils pourront imiter la voix de n'importe qui, y compris celle du président.
Heureusement, nous n'avons pas encore à nous soucier des fausses vidéos d'IA. L'IA de synchronisation labiale n'a pas été entièrement perfectionnée, et les mouvements de la bouche semblent encore un peu flous et ne correspondent pas aussi bien à la parole normale. Cependant, les images de test de l'équipe de recherche montrent l'incroyable potentiel de la technologie, à la fois bon et mauvais.
Vous pouvez regarder une vidéo de l'IA en action ci-dessous