Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 1610

Incidentes Asociados

Incidente 1904 Reportes
ByteDance Allegedly Trained "For You" Algorithm Using Content Scraped without Consent from Other Social Platforms

Loading...
ByteDance creó cuentas falsas con contenido extraído de Instagram y Snapchat, dicen exempleados
buzzfeednews.com · 2022

La empresa con sede en China extrajo cuentas públicas y luego las duplicó en Flipagram, un predecesor de TikTok, según cuatro exempleados y documentos vistos por BuzzFeed News.

En 2017, la empresa matriz de TikTok, ByteDance, extrajo videos cortos, nombres de usuario, imágenes de perfil y descripciones de perfil de Instagram, Snapchat y otras fuentes y luego los subió, sin el conocimiento o consentimiento de los usuarios, a Flipagram, un predecesor de TikTok. según cuatro ex empleados de la empresa.

BuzzFeed News habló con los cuatro ex empleados de ByteDance, todos los cuales trabajaron en Flipagram (más tarde rebautizado como Vigo Video), y vieron documentos internos que indican que el raspado estuvo a cargo de un equipo de ingeniería en China y comenzó poco después de que ByteDance adquiriera Flipagram en enero de 2017. Los exempleados describieron el proyecto como uno de varios "hacks de crecimiento", incluida la manipulación de estadísticas de visualización de videos y Me gusta, empleados por la empresa. Uno de los exempleados dijo que el raspado afectó a cientos de miles de cuentas, y un documento visto por BuzzFeed News detallaba los planes para "rastrear videos > 10k/día en países P0"; según el exempleado, esto significaba que el objetivo del equipo era extraiga más de 10 000 videos al día en los países de mayor prioridad. Los exempleados hablaron con BuzzFeed News bajo condición de anonimato porque temían represalias por parte de ByteDance.

Los exempleados no saben cuándo cesó el raspado del que dicen estar al tanto. Dos de ellos dicen que el contenido extraído se usó para entrenar el poderoso algoritmo de personalización "Para ti" de ByteDance en contenido basado en EE. UU. para que refleje mejor las preferencias de los usuarios de EE. UU. Hoy, el algoritmo "Para ti" impulsa tanto a TikTok como a su equivalente chino, Douyin. (Divulgación: en una vida anterior, ocupé cargos políticos en Facebook y Spotify).

BuzzFeed News envió a ByteDance una lista completa de las acusaciones que pretendíamos publicar en este artículo, así como un conjunto detallado de preguntas, incluso si alguna vez se usaron conjuntos de datos de Flipagram para entrenar el algoritmo "Para ti" que impulsa TikTok hoy o para entrenar cualquier otro algoritmo actualmente en uso por ByteDance.

En respuesta, la portavoz de ByteDance, Jennifer Banks, respondió con dos frases: “ByteDance adquirió Flipagram en 2017 y lo operó, y posteriormente a Vigo, por un corto tiempo. Flipagram y Vigo cesaron sus operaciones hace años y no están conectados a ningún producto ByteDance actual".

El fundador y ex director ejecutivo de Flipagram, Farhad Mohit, no respondió a las solicitudes de comentarios, ni tampoco sus cofundadores, Raffi Baghoomian y Joshua Feldman. BuzzFeed News sí llegó a Brian Dilley, quien fue director de tecnología de Flipagram hasta octubre de 2017, en su casa. Cuando se le preguntó si la compañía había estado extrayendo y volviendo a cargar contenido en 2017, respondió: "No, de hecho, estoy seguro de que no". Luego terminó la entrevista. BuzzFeed News envió a Dilley un correo electrónico de seguimiento pidiéndole que elaborara su respuesta y explicara su comprensión de lo que estaba sucediendo en ese momento. Dilley reiteró que la compañía no había raspado otras plataformas durante su tiempo allí.

Los documentos revisados por BuzzFeed News incluyen referencias explícitas a contenido extraído y al uso de cuentas falsas. En un documento, un empleado expone las razones por las que la empresa usó "cuentas falsas" y extrajo contenido; entre ellos estaban que las cuentas podrían usarse para probar qué contenido funcionaba mejor en la plataforma y que los usuarios actuales podrían imitar el contenido extraído para mejorar su propia popularidad. En otro documento, otro empleado explica que cierta cuenta se raspó y se copió en Flipagram desde Instagram. Un tercer documento enumera el raspado de cuentas como un "OKR" ('objetivo y resultado clave') para un equipo de ingeniería en China.

Según los documentos, ByteDance comenzó a copiar contenido de algunas de sus aplicaciones de video de formato corto enfocadas en China y lo subió a Flipagram a través de cuentas falsas a principios de 2017. Un documento detalla cómo la compañía trató de seleccionar contenido que "no era demasiado chino". y resonaría entre los usuarios de EE. UU., pero tres de los ex empleados dicen que el contenido todavía no funcionó bien con la base de usuarios de Flipagram.

A mediados de 2017, según los cuatro ex empleados, ByteDance comenzó a recopilar y volver a cargar contenido de EE. UU. Tres de los exempleados y uno de los documentos identifican a Instagram como fuente del contenido extraído. Dos de los exempleados recuerdan que la empresa recopilaba y subía contenido de Snapchat y Musical.ly, una aplicación popular entre preadolescentes y adolescentes que ByteDance adquirió a fines de 2017 y que eventualmente se convertiría en TikTok.

Uno de los exempleados que identificó a Snapchat y Musical.ly como fuentes del raspado no identificó a Instagram como tal. Esta persona expresó sus dudas de que la plataforma haya sido eliminada porque al menos algunos videos de Instagram en ese momento tenían forma cuadrada y los videos en la aplicación Flipagram no lo eran. Sin embargo, otro ex empleado le dijo a BuzzFeed News que recordaba conversaciones sobre cómo cambiar el tamaño de los videos y eliminar las marcas de agua colocadas en el contenido por otras plataformas, para que los usuarios no pudieran notar que el contenido raspado se originó en otro lugar.

Los términos de servicio de Instagram y Snap prohibían el scraping en 2017, como lo hacen hoy. En ese momento, los términos de servicio de Musical.ly prohibían a los usuarios "hacer [ing] copias no autorizadas de cualquier contenido disponible en o a través de" la plataforma.

Jason Grosse, representante de la empresa matriz de Instagram, Meta, dijo que la compañía no haría comentarios en este momento. Russ Caditz-Peck, vocero de Snap, dijo: “Nuestros Términos de servicio prohíben extraer y volver a publicar contenido público de nuestros servicios, e implementamos defensas para limitar tales intentos”.

En otras circunstancias, las denuncias de que las empresas extrajeron y reutilizaron contenido sin permiso han provocado litigios, tanto por parte de las empresas como de las personas que crearon el contenido en cuestión. (El raspado o rastreo, que simplemente significa usar una computadora para copiar información a escala, también puede ser una herramienta de investigación invaluable para investigadores y periodistas que buscan estudiar y analizar mejor el contenido público). Las empresas que han usado cuentas falsas para atraer a los usuarios a su Las plataformas también han sido demandadas por reguladores estatales y federales por prácticas comerciales engañosas.

Algunas personas notaron que su contenido había sido subido a Flipagram sin su conocimiento o consentimiento, según los cuatro ex empleados y las denuncias realizadas en Twitter. Los cuatro exempleados le dijeron a BuzzFeed News que la empresa recibió correos electrónicos de creadores que decían que estaban siendo suplantados en la aplicación. Dos de esas personas recuerdan consultas de padres que preguntaron por qué el contenido de sus hijos estaba en una plataforma de la que ni ellos ni sus hijos habían oído hablar. Las cuatro fuentes dijeron que los empleados recibieron instrucciones de eliminar las cuentas infractoras o darle a la persona que se queja el control sobre ellas, y decirles a los creadores que se quejaron que Flipagram no puede evitar que un usuario (o fanático) cargue el contenido de otra persona.

Los exempleados también describieron otros "trucos de crecimiento" que ByteDance usó para intentar que Flipagram fuera popular en 2017. Según tres de los exempleados, la empresa manipuló los recuentos de me gusta y vistas de video que se mostraban en la aplicación para hacer creer a los creadores que eran más populares. de lo que eran. “Un like no era un like”, dijo un exempleado que presenció la manipulación. (Facebook se ha enfrentado a acusaciones similares de que infló a sabiendas las métricas de reproducción de videos para aumentar los ingresos por publicidad, lo que ha cuestionado).

Según un documento interno, ByteDance también limitó las vistas de video del contenido extraído en un cierto nivel; uno de los exempleados explicó que esto era para que las visualizaciones de contenido extraídas no abrumaran el contenido publicado por usuarios reales de Flipagram. Además, según dos fuentes, Flipagram limitó la frecuencia con la que recomendaría "publicaciones cruzadas" (contenido publicado primero en otras plataformas y luego vuelto a publicar en Flipagram) para incentivar a los creadores a publicar contenido primero en Flipagram y solo después en otras plataformas.

ByteDance no respondió a las preguntas sobre la manipulación de métricas y prácticas de recomendaciones para Flipagram.

Un exempleado describió las tácticas de crecimiento de ByteDance como un síntoma de una obsesión más grande en toda la industria con el crecimiento a cualquier costo. "El público estadounidense y los medios estadounidenses a menudo atribuyen las estrategias de crecimiento poco éticas practicadas por las empresas tecnológicas chinas a la 'cultura tecnológica china', cuando muy a menudo esas tácticas se copian directamente de las empresas FAANG", dijeron, utilizando un acrónimo de los gigantes tecnológicos estadounidenses Facebook, Amazon, Apple, Netflix y Google. Invocando la famosa cita de Steve Jobs de que “los grandes artistas roban” y el controvertido axioma de Mark Zuckerberg “muévete rápido y rompe cosas”, esta persona continuó: “La cultura tecnológica china no es el enemigo. La cultura tecnológica china es un espejo honesto”.

Flipagram fue fundada en Los Ángeles por Farhad Mohit en 2013 como una aplicación de collage de fotos y videos de formato corto. Atrajo a una audiencia joven, en su mayoría adolescentes y preadolescentes, y una vez fue visto como una amenaza para Instagram. En enero de 2017, fue adquirida por la aplicación de agregador de noticias de ByteDance, Toutiao, que luego la renombró como Vigo Video. Más tarde ese año, ByteDance también adquirió la aplicación de sincronización de labios Musical.ly, uno de los principales rivales de Flipagram.

Durante un tiempo, el personal de las dos aplicaciones trabajó en conjunto en el edificio de oficinas de planta abierta de Flipagram en Los Ángeles. Los ex empleados describieron el período como incómodo; como lo expresó un exempleado, la historia de competencia de los equipos “condujo a una energía incómoda y poco colaboradora en el lugar de trabajo”. Los productos, dijo la fuente, "eran tan similares que no creo que nadie sintiera que ByteDance iba a poner su financiación completamente detrás de ambos". En febrero de 2018, ByteDance despidió a miembros del equipo de Flipagram con sede en Los Ángeles. Meses después, cambió el nombre de Musical.ly a TikTok.

La relación entre Flipagram y TikTok es descrita de manera diferente por diferentes personas. En su sitio web y perfil de LinkedIn, el fundador de Flipagram, Mohit, describe a Flipagram como "ahora TikTok". El perfil de empresa de Flipagram en LinkedIn lo describe de la misma manera. Pero cuando ByteDance lanzó TikTok en los EE. UU., fueron los usuarios de Musical.ly, no los usuarios de Flipagram, quienes abrieron sus aplicaciones con un nuevo nombre, logotipo y experiencia.

ByteDance tampoco respondió preguntas de BuzzFeed News sobre dónde y cómo almacenó los datos que supuestamente extrajo de Instagram y otras plataformas. TikTok ha llevado a cabo una iniciativa masiva el año pasado para aislar los datos de los usuarios dentro de los EE. UU. en un esfuerzo por calmar los temores de los reguladores de que el gobierno chino pueda acceder a los datos. Pero no está claro si los datos de Flipagram, incluidos los datos supuestamente extraídos, alguna vez se guardaron en centros de datos en China o si permanecen allí hoy.

Cuando BuzzFeed News lo contactó para que comentara sobre el presunto raspado, el senador Richard Blumenthal pidió a los reguladores que investigaran: “La FTC debe investigar rápidamente el presunto robo de datos de los usuarios de Instagram y Snapchat por parte de ByteDance, incluidos niños y adolescentes, para engañar al público e impulsar su algoritmo. Este tipo de conducta corporativa ilícita y codiciosa solo subraya la necesidad urgente de que el Congreso apruebe una legislación más estricta sobre la privacidad y la seguridad de los niños”.

Esta no es la primera vez que ByteDance ha sido acusado de prácticas controvertidas de propiedad intelectual. El año pasado, el gigante tecnológico chino Tencent presentó numerosos reclamos contra ByteDance por presunta infracción de derechos de autor en su aplicación Douyin. La compañía de software audiovisual Beijing Meishe Network Technology Co. también presentó una demanda alegando que la compañía robó y eliminó el lenguaje restrictivo de derechos de autor del código propietario. (ByteDance no respondió a una solicitud de comentarios sobre ninguno de los juicios). La compañía también enfrentó demandas de privacidad en el pasado: ByteDance acordó pagar $ 92 millones el año pasado para resolver una demanda que alegaba que la compañía recopiló información biométrica de los usuarios de TikTok. sin permiso. Cuando Associated Press le pidió un comentario en ese momento, TikTok proporcionó la siguiente declaración: “Si bien no estamos de acuerdo con las afirmaciones, en lugar de pasar por un largo litigio, nos gustaría centrar nuestros esfuerzos en construir una experiencia segura y alegre para el comunidad de TikTok”.

Flipagram también tuvo una historia cargada de propiedad intelectual, incluso antes de que ByteDance la adquiriera. En 2016, el director ejecutivo Farhad Mohit admitió que la empresa inicialmente había permitido a los usuarios crear contenido utilizando música que la plataforma no tenía derecho a reproducir. En una entrevista con Recode en ese momento, Mohit reveló su pensamiento sobre doblar las reglas en busca del crecimiento.

"Lo hicimos como lo hacen los empresarios a veces, simplemente lo hicimos y [decidimos] que pediríamos permiso después".

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd