Incidente 283: La herramienta de moderación de contenido automatizada de Facebook marcó por error una publicación que contenía partes de la Declaración de Independencia como discurso de odio.
Descripción: El algoritmo de moderación de contenido de Facebook reconoció que había marcado por error extractos de la Declaración de Independencia publicados por un pequeño periódico de Texas como discurso de odio.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por Facebook, perjudicó a The Vindicator.
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
7.3. Lack of capability or robustness
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- AI system safety, failures, and limitations
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
Informes del Incidente
Cronología de Informes
- Facebook se disculpó por eliminar una publicación que contenía extractos de la Declaración de Independencia, diciendo que se marcó por error como discurso de odio.
- Además de disculparse, Facebook ha restaurado la publicación.
- Este es solo …
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?