Incidentes Asociados
David Greene nunca había oído hablar de NotebookLM, la herramienta de inteligencia artificial de Google que genera podcasts a la carta, hasta que un excompañero le envió un correo electrónico preguntándole si le había prestado su voz.
"Bueno... probablemente soy la persona número 148 que me pregunta esto, pero ¿licenciaste tu voz a Google?", preguntó el excompañero en un correo electrónico de otoño de 2024. "¡Suena muy parecido a ti!".
Greene, veterano de la radio pública que ha presentado "Morning Edition" de NPR y el podcast político "Left, Right & Center" de KCRW, buscó la herramienta y escuchó a los dos copresentadores virtuales —un hombre y una mujer— charlar entre ellos.
"Me quedé como muerto de miedo", dijo Greene. "Es un momento inquietante en el que sientes que te estás escuchando a ti mismo".
Greene sintió que la voz masculina sonaba exactamente igual que él, desde la cadencia y la entonación hasta el ocasional "uhh" o "me gusta" que Greene se había esforzado durante años por minimizar, pero nunca eliminar. Dijo que se la puso a su esposa y que sus ojos se abrieron de par en par.
A medida que llegaban correos electrónicos y mensajes de amigos, familiares y compañeros de trabajo preguntando si la voz del podcast con inteligencia artificial era suya, Greene se convenció de que lo habían estafado. Ahora ha demandado a Google, alegando que violó sus derechos al crear un producto que replicaba su voz sin pago ni permiso, dando a los usuarios el poder de hacer que dijera cosas que Greene jamás diría.
Google declaró el jueves a The Washington Post que la voz masculina del podcast de NotebookLM no tiene nada que ver con Greene. Ahora, un tribunal del condado de Santa Clara, California, podría tener que determinar si el parecido es lo suficientemente asombroso como para que la gente común que escuche la voz asuman que es suya y, de ser así, qué hacer al respecto.
Este caso es el más reciente en enfrentar los derechos de los creadores humanos individuales con los de una industria de IA en auge que promete transformar la economía al permitir a las personas generar discursos, prosa, imágenes y videos increíblemente realistas a pedido. Detrás de las voces artificiales en NotebookLM y herramientas similares se encuentran modelos de lenguaje entrenados en vastas bibliotecas de textos y discursos por humanos reales a quienes nunca se les dijo que sus palabras y voces se usarían de esa manera, lo que plantea profundas preguntas sobre derechos de autor y propiedad. Desde "voicefakes" políticos hasta OpenAI promocionando una voz femenina para ChatGPT que se parecía a la de la actriz Scarlett Johansson, hasta anuncios fraudulentos de deepfake que tenían una Taylor Swift promocionando Le Creuset vaticana, los problemas planteados por la demanda de Greene "van a surgir mucho", dijo James Grimmelmann, un Profesor de Derecho Digital y de la Información en la Universidad de Cornell.
Una cuestión clave que los tribunales deberán decidir, según Grimmelmann, será qué tan parecida debe ser la voz o imagen de una IA al artículo original para que se considere infractora. Otra cuestión será si la voz de Greene es lo suficientemente famosa como para que la gente común la reconozca al escuchar NotebookLM y si el parecido le perjudica.
Estas pueden ser preguntas espinosas cuando se trata de voces de IA. Existen herramientas de software que pueden comparar las voces de las personas, pero se utilizan más comúnmente para encontrar o descartar una coincidencia exacta entre las voces de humanos reales, en lugar de una sintética.
Para Greene, el parecido de la voz de la IA con la suya es asombroso, y el daño es más profundo y personal que simplemente una oportunidad perdida de aprovechar su activo más reconocible.
"Mi voz es, prácticamente, la parte más importante de quien soy", dijo Greene.
"Estas acusaciones son infundadas", afirmó el portavoz de Google, José Castañeda. El sonido de la voz masculina en las Vistas de Audio de NotebookLM se basa en un actor profesional contratado por Google.
El abogado de Greene argumenta que las grabaciones evidencian el parecido. "Confiamos en el tribunal y animamos a la gente a escuchar el audio de ejemplo", declaró Joshua Michelangelo Stein, socio del bufete Boies Schiller Flexner, que también representa a autores de libros en una demanda de derechos de autor de IA de alto perfil contra Meta.
La función "Vista de Audio" de NotebookLM causó sensación en su lanzamiento en 2024, con entusiastas de la IA que compartieron ejemplos de su uso para resumir documentos extensos, reemplazando docenas de páginas de texto con un podcast ágil que resaltaba los puntos principales. Aunque Google no ha revelado cuántas personas usan la herramienta, se convirtió en un éxito inesperado para el gigante de las búsquedas en su carrera con rivales como OpenAI, creador de ChatGPT, por captar la atención de los consumidores. En diciembre de 2024, Spotify, líder de la música en streaming, utilizó la herramienta como parte de su función distintiva "Spotify Wrapped", que ofrecía a cada usuario un podcast personalizado sobre sus hábitos de escucha.
En línea, los usuarios han hecho numerosas conjeturas sobre a quién se parecen más las voces de los podcasters de IA. Algunos han nombrado a Greene, pero otros han mencionado al expodcaster tecnológico Leo Laporte o al podcast de comedia "Armchair Expert", copresentado por Dax Shepard y Monica Padman.
De niño, Greene crecía en Pittsburgh y idolatraba a Lanny Frattare, la voz del equipo de béisbol profesional de la ciudad durante mucho tiempo. "Me sentaba en los partidos de los Piratas de Pittsburgh y actuaba como si fuera el locutor de las jugadas", recordó.
En el instituto, él y dos amigos hacían los anuncios matutinos de su instituto, que convirtieron en una especie de programa de radio. Escribió un ensayo para su solicitud de ingreso a la universidad sobre su sueño de convertirse algún día en locutor de radio pública, un ensayo que su madre desenterró y le envió cuando consiguió su primer trabajo en NPR en 2005.
Allí, Greene fue asesorado por Don Gonyea, corresponsal político nacional de NPR durante muchos años. Aprendió trucos del oficio, como fingir que se dirigía a un amigo en la sala en lugar de a una multitud distante, para que su voz sonara conversacional en lugar de "emisora".
Los comentarios de los oyentes y los entrevistados le indicaron a Greene que su cálida voz de barítono tenía el poder de tranquilizar y transmitir confianza y empatía. En "Morning Edition", la suya fue la voz con la que despertaron unos 13 millones de oyentes entre 2012 y 2020, según NPR, convirtiéndolo en el programa de radio de noticias más popular de Estados Unidos. En "Left, Right & Center", interpreta a un moderado que busca puntos en común entre los comentaristas de izquierda y derecha.
"Creo firmemente que las conversaciones tienen el poder de cambiar nuestras vidas y cambiar el mundo", dijo Greene. "Una de las razones por las que nos encontramos en un entorno tan polarizado es porque la gente está olvidando el poder de comunicarse".
Por eso, la sensación de que Google se ha apropiado de su voz y la ha convertido en un robot resulta tan irritante para Greene.
"Leí un artículo en The Guardian sobre cómo esta herramienta de podcast puede usarse para difundir teorías conspirativas y dar credibilidad a los temas más desagradables de nuestra sociedad", dijo. "Que algo que suena como yo se usara para eso fue realmente preocupante".
La demanda de Greene, presentada el mes pasado en el Tribunal Superior del Condado de Santa Clara, alega, pero no ofrece pruebas, que Google entrenó NotebookLM con su voz. La demanda cita a una empresa forense de inteligencia artificial anónima que utilizó su software para comparar la voz artificial con la de Greene. La herramienta otorgó una calificación de confianza del 53 % al 60 % en que la voz de Greene se utilizó para entrenar el modelo, lo que considera una confianza "relativamente alta" para una comparación entre la voz de una persona real y una artificial. (Una puntuación de confianza superior a cero significa que las voces son similares, mientras que una puntuación inferior a cero indica que probablemente sean diferentes).
Grimmelmann afirmó que Greene no necesariamente tiene que demostrar definitivamente que Google entrenó NotebookLM con su voz para tener argumentos válidos, ni siquiera que la voz sea 100 % idéntica a la suya. Citó un caso de 1988 en el que la cantante y actriz Bette Midler demandó con éxito a Ford Motor Company por un anuncio que utilizaba a un actor de doblaje para imitar su distintiva voz de mezzosoprano. Pero Greene tendría que demostrar que suficientes oyentes asumen que es su voz como para que esto afecte su reputación o sus propias oportunidades de sacarle provecho.
Mike Pesca, presentador del podcast "The Gist" y excolega de Greene en NPR, afirmó tener buen oído para las voces y su afición por intentar identificar a los actores y famosos que se esconden tras las voces en off de los anuncios de televisión.
La primera vez que escuchó NotebookLM, Pesca comentó: "De inmediato pensé: 'Ese es David Greene'".
Pesca comentó que al principio asumió que Google había entrenado intencionalmente la herramienta con la voz de Greene y que este había recibido una compensación.
"Si yo fuera David Greene, me enojaría, no solo porque me robaron la voz", dijo Pesca, sino porque la usaron para crear el equivalente en podcasts a la "basura" de la IA, un término para contenido spam y comercializado. "Intercambian bromas, pero son bromas muy superficiales y poco profundas, y siempre dicen: 'Sí, eso es muy interesante'. Es realmente malo, porque ¿qué tenemos como presentadores de programas excepto nuestro gusto por los comentarios y dirigir a nuestra audiencia hacia lo que es interesante?".
Greene no es el primer profesional del audio en quejarse de que le robaron la voz. Numerosos actores de doblaje se han mostrado consternados al escuchar voces que suenan como ellas en diversas herramientas de IA. Sin embargo, se enfrentan a una ardua batalla judicial, en parte porque generalmente no son figuras famosas, aunque sus voces resulten familiares, y porque muchos contratos de actores de doblaje licencian sus voces para una amplia gama de usos.
Proyectos de ley presentados en varios estados y en el Congreso han buscado regular el uso de las voces de personas en herramientas de IA. Greene, sin embargo, se basa en leyes estatales de larga data que otorgan a las figuras públicas ciertos derechos para controlar cómo se monetiza su propia imagen.
Adam Eisgrau, director de políticas de derechos de autor de IA para la Cámara del Progreso, grupo tecnológico de centroizquierda, afirmó que cree que esas leyes son suficientes para abordar casos como el de Greene sin necesidad de aprobar nuevas leyes de IA a nivel nacional.
"Si un jurado de California determina que la voz de NotebookLM es totalmente la del Sr. Greene, podría ganar", declaró Eisgrau por correo electrónico. "Si descubren que tiene atributos que él también posee, pero que se trata fundamentalmente del tono y la forma de hablar de un presentador arquetípicos, aprendidos de un amplio conjunto de datos, puede que no gane".
Greene afirmó que no está presionando a favor de nuevas leyes que puedan frenar la innovación. Simplemente cree que Google debería haberle pedido permiso antes de lanzar un producto basado en una voz que, en su opinión, es esencialmente suya.
"No soy ningún activista anti-IA desquiciado", afirmó. "Simplemente ha sido una experiencia muy extraña".