Incident 222: L'application Thoughts aurait créé des tweets toxiques

Description:

Les tweets créés par Thoughts, une application de génération de tweets qui exploite GPT-3 d'OpenAI, auraient montré une toxicité lorsqu'ils étaient confrontés à des questions liées à des groupes minoritaires.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Alleged: OpenAI developed an AI system deployed by Satria Technologies, which harmed Thoughts users et Twitter Users.

Statistiques d'incidents

222

Nombre de rapports

Date de l'incident

2020-07-18

Editeurs

Khoa Lam

Applied Taxonomies

GMF, MIT

Classifications de taxonomie MIT

Machine-Classified

Détails de la taxonomie

Risk Subdomain

1.1. Unfair discrimination and misrepresentation

Risk Domain

Discrimination and Toxicity

Entity

Timing

Post-deployment

Intent

Unintentional

Rapports d'incidents

Chronologie du rapport

Tweet : an_open_mind

twitter.com

twitter.com · 2020

Traduit par IA

#gpt3 est surprenant et créatif, mais il est également dangereux en raison de biais nuisibles. Invité à écrire des tweets à partir d'un seul mot - juifs, noirs, femmes, holocauste - il est venu avec ceux-ci (https://pensées.sushant-kumar.co…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?

Incident précédent Prochain incident