Incidentes Asociados
En la prensa han aparecido noticias sobre los resultados de un proyecto de investigación de la Universidad de Stanford, según el cual el equipo de entrenamiento LAION 5B contiene contenidos potencialmente ilegales en forma de CSAM. Nos gustaría comentar esto de la siguiente manera:
LAION es una organización sin fines de lucro que proporciona conjuntos de datos, herramientas y modelos para el avance de la investigación del aprendizaje automático. Estamos comprometidos con la educación pública abierta y el uso ambientalmente seguro de los recursos mediante la reutilización de conjuntos de datos y modelos existentes.
Los conjuntos de datos de LAION (más de 5,85 mil millones de entradas) provienen del índice web Common Crawl disponible de forma gratuita y solo ofrecen enlaces a contenido en la web pública, sin imágenes. Desarrollamos y publicamos nuestros propios filtros rigurosos para detectar y eliminar contenido ilegal de los conjuntos de datos de LAION antes de publicarlos.
LAION colabora con universidades, investigadores y ONG para mejorar estos filtros y actualmente está trabajando con la Internet Watch Foundation (IWF) para identificar y eliminar contenido sospechoso de violar las leyes. LAION invita a los investigadores de Stanford a unirse a su comunidad para mejorar nuestros conjuntos de datos y desarrollar filtros eficientes para detectar contenido dañino.
LAION tiene una política de tolerancia cero con el contenido ilegal y, con mucha precaución, estamos eliminando temporalmente los conjuntos de datos de LAION para garantizar que estén seguros antes de volver a publicarlos.
Tras una conversación con el responsable de protección de datos del estado de Hamburgo, también nos gustaría señalar que los datos CSAM son datos que deben eliminarse inmediatamente por motivos de protección de datos de conformidad con el art. 17 RGPD.