Incidente 453: La herramienta de moderación de inteligencia artificial de Twitter identificó erróneamente los cohetes como pornografía
Descripción: La moderación automatizada de contenido de Twitter identificó erróneamente imágenes de lanzamientos de cohetes como contenido pornográfico, lo que provocó suspensiones de cuentas incorrectas.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por Twitter, perjudicó a Twitter Users.
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
7.3. Lack of capability or robustness
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- AI system safety, failures, and limitations
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
Informes del Incidente
Cronología de Informes
Un exempleado de Twitter dijo que la compañía de Elon Musk puede confundir fotos de cohetes con contenido íntimo debido a la dependencia de la plataforma de herramientas de aprendizaje automático, según [Quartz](https://qz.com/elon-musks-tw…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?