Incidente 222: La aplicación Thoughts supuestamente creó tweets tóxicos

Descripción:

Los tuits creados por Thoughts, una aplicación de generación de tuits que aprovecha GPT-3 de OpenAI, supuestamente exhibieron toxicidad cuando se les dieron indicaciones relacionadas con grupos minoritarios.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Alleged: OpenAI developed an AI system deployed by Satria Technologies, which harmed Thoughts users y Twitter Users.

Estadísticas de incidentes

222

Cantidad de informes

Fecha del Incidente

2020-07-18

Editores

Khoa Lam

Applied Taxonomies

GMF, MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

1.1. Unfair discrimination and misrepresentation

Risk Domain

Discrimination and Toxicity

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Twittear: an_open_mind

twitter.com

twitter.com · 2020

Traducido por IA

#gpt3 es sorprendente y creativo, pero también es inseguro debido a sesgos dañinos. Cuando se le pidió que escribiera tuits a partir de una palabra (judíos, negros, mujeres, holocausto), se le ocurrieron estos (https://pensamientos.sushant-…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidente Anterior Siguiente Incidente