Incidentes Asociados

En un mundo posterior a Photoshop, la mayoría de nosotros sabemos que no siempre se puede confiar en las imágenes. Ahora, gracias a la inteligencia artificial, parece que el video también podría mentirnos.
Investigadores de la Universidad de Washington han desarrollado una IA que puede alterar las imágenes de video de una persona hablando para hacer que sus labios coincidan con diferentes audios, literalmente poniendo palabras en su boca.
Los investigadores entrenaron su IA utilizando grabaciones de video y audio del expresidente Barack Obama. Más específicamente, la IA aprendió de alrededor de 14 horas de imágenes de alta calidad de los videos de discursos semanales del presidente que se transmitieron durante su tiempo en el cargo.
Usando una red neuronal recurrente, la IA pudo hacer coincidir las palabras habladas del presidente con las formas de la boca que hizo durante los videos. Luego, el programa creó texturas bucales en 3D para los diferentes sonidos y las mapeó en la cara del presidente en otros videos. El equipo detrás de la IA sugirió que podría usarse con programas de chat de video como Skype para mejorar la calidad del video sin requerir tanto ancho de banda.
Por supuesto, mejorar el chat de video no es la única forma en que se podría usar la IA. Aunque los investigadores trasplantaron solo palabras que en realidad dijo el presidente Obama en algún momento, su proyecto plantea algunas preguntas aterradoras sobre el futuro de la IA.
Con los problemas recientes con las noticias falsas en Internet, no es difícil imaginar las implicaciones de una IA que puede crear videos falsos de alguien diciendo casi cualquier cosa. Sin embargo, los creadores de la IA se apresuraron a señalar que su programa solo funciona con el audio del altavoz real.
“No se puede simplemente tomar la voz de nadie y convertirla en un video de Obama”, dijo Steve Seitz, profesor de la Universidad de Washington y uno de los investigadores detrás de la nueva IA. “Decidimos muy conscientemente no seguir el camino de poner las palabras de otras personas en la boca de alguien. Simplemente tomamos palabras reales que alguien dijo y las convertimos en videos realistas de esa persona”.
Es posible que la IA no funcione con la voz de cualquiera, pero eso puede no ser un problema gracias a algunos de los programas de voz de IA en proceso. Por ejemplo, el gigante web chino Baidu Inc. ha creado una IA que puede replicar cientos de acentos diferentes, y puede hacerlo aprendiendo de muestras de audio relativamente cortas. Cuando la tecnología de Baidu o proyectos similares estén lo suficientemente avanzados, podrán imitar la voz de cualquiera, incluida la del presidente.
Afortunadamente, todavía no tenemos que preocuparnos por los videos falsos de IA. La IA de sincronización de labios no se ha perfeccionado por completo, y los movimientos de la boca todavía se ven un poco borrosos y no coinciden tan bien como el habla normal. Sin embargo, las imágenes de prueba del equipo de investigación muestran el increíble potencial de la tecnología, tanto bueno como malo.
Puedes ver un video de la IA en acción a continuación.