Incidente 377: El modelo de Weibo tuvo dificultades para detectar cambios en el discurso censurado
Descripción: El modelo de moderación de usuarios de Weibo está teniendo dificultades para adaptarse al cambio en la jerga de los usuarios, desafiando así a los censores del estado chino.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por Weibo, perjudicó a Weibo y Chinese government.
Estadísticas de incidentes
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
5.2. Loss of human agency and autonomy
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Human-Computer Interaction
Entity
Which, if any, entity is presented as the main cause of the risk
Human
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Intentional
Informes del Incidente
Cronología de Informes

En 2018, #MeToo, el hashtag que personas de todo el mundo usan para hablar sobre el acoso sexual, fue bloqueado en las redes sociales en China.
Los internautas del país formaron un nuevo hashtag para seguir creando conciencia. Usaron los ca…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents