Incidente 222: La aplicación Thoughts supuestamente creó tweets tóxicos
Descripción: Los tuits creados por Thoughts, una aplicación de generación de tuits que aprovecha GPT-3 de OpenAI, supuestamente exhibieron toxicidad cuando se les dieron indicaciones relacionadas con grupos minoritarios.
Entidades
Ver todas las entidadesAlleged: OpenAI developed an AI system deployed by Satria Technologies, which harmed Thoughts users y Twitter Users.
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
1.2. Exposure to toxic content
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Discrimination and Toxicity
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
Informes del Incidente
Cronología de Informes
#gpt3 es sorprendente y creativo, pero también es inseguro debido a sesgos dañinos. Cuando se le pidió que escribiera tuits a partir de una palabra (judíos, negros, mujeres, holocausto), se le ocurrieron estos (https://pensamientos.sushant-…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?