Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 3562

Incidentes Asociados

Incidente 62418 Reportes
Child Sexual Abuse Material Taints Image Generators

Loading...
Error importante encontrado en el conjunto de datos de entrenamiento más grande de Stable Diffusion
analyticsvidhya.com · 2023

La integridad de un importante conjunto de datos de entrenamiento de imágenes de IA, LAION-5B, utilizado por modelos de IA influyentes como Stable Diffusion, se ha visto comprometida después del descubrimiento de miles de enlaces a material de abuso sexual infantil (CSAM). Esta revelación ha generado preocupaciones sobre las posibles ramificaciones de que dicho contenido se infiltre en el ecosistema de IA.

La revelación de contenido inquietante

Los investigadores del Stanford Internet Observatory son quienes descubrieron la inquietante verdad detrás del conjunto de datos LAION-5B. Revelaron que el conjunto de datos contenía más de 3.000 casos sospechosos de CSAM. Este extenso conjunto de datos, parte integral del ecosistema de IA, se enfrentó a la eliminación tras el impactante descubrimiento realizado por el equipo de Stanford.

Eliminación temporal de LAION-5B

LAION es una organización sin fines de lucro responsable de crear herramientas de código abierto para el aprendizaje automático. En respuesta a los hallazgos, la organización decidió eliminar temporalmente sus conjuntos de datos, incluido LAION-5B y otro llamado LAION-400M. La organización expresó su compromiso de garantizar la seguridad de sus conjuntos de datos antes de volver a publicarlos.

La metodología detrás del descubrimiento

Los investigadores de Stanford emplearon una combinación de métodos de detección basados en hash perceptivo y criptográfico para identificar casos sospechosos de CSAM en el conjunto de datos LAION-5B. Su estudio generó preocupaciones sobre el uso indiscriminado de Internet con fines de entrenamiento de IA. Además, destacó los peligros asociados con tales prácticas.

El efecto dominó en las empresas de IA

Las principales empresas de IA generativa, incluida Stable Diffusion, confiaron en LAION-5B para entrenar sus modelos. El artículo de Stanford destacó la influencia potencial del CSAM en los resultados del modelo de IA y el refuerzo de imágenes dañinas dentro del conjunto de datos. Las repercusiones se extendieron a otros modelos, como Imagen de Google, que encontró contenido inapropiado en los conjuntos de datos de LAION durante una auditoría.

Nuestra opinión

Las revelaciones sobre la inclusión de material de abuso sexual infantil en el conjunto de datos LAION-5B subrayan la necesidad de prácticas responsables en el desarrollo y utilización de conjuntos de datos de entrenamiento de IA. El incidente plantea dudas sobre la eficacia de los mecanismos de filtrado existentes y la responsabilidad de las organizaciones de consultar con expertos para garantizar la seguridad y legalidad de sus conjuntos de datos. Mientras la comunidad de IA se enfrenta a estos desafíos, es imperativa una reevaluación integral de los procesos de creación de conjuntos de datos para evitar la perpetuación involuntaria de contenido ilegal y dañino a través de modelos de IA.

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd