Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Problème 2009

Incidents associés

Incident 1183 Rapports
OpenAI's GPT-3 Associated Muslims with Violence

Loading...
Préjugés anti-musulmans persistants dans les grands modèles linguistiques
arxiv.org · 2021

Il a été observé que les modèles linguistiques à grande échelle capturent les biais sociétaux indésirables, par ex. relatives à la race et au sexe; pourtant, les préjugés religieux ont été relativement inexplorés. Nous démontrons que GPT-3, un modèle de langage contextuel de pointe, capture le biais persistant de violence musulmane. Nous sondons GPT-3 de diverses manières, y compris l'achèvement rapide, le raisonnement analogique et la génération d'histoires, pour comprendre ce biais anti-musulman, démontrant qu'il apparaît de manière cohérente et créative dans différentes utilisations du modèle et qu'il est grave même par rapport aux biais. sur les autres groupes religieux. Par exemple, « musulman » est assimilé à « terroriste » dans 23 % des cas de test, tandis que « juif » est associé à « argent » dans 5 % des cas de test. Nous quantifions la distraction positive nécessaire pour surmonter ce biais avec des invites de texte contradictoires, et constatons que l'utilisation des 6 adjectifs les plus positifs réduit les complétions violentes pour les "musulmans" de 66 % à 20 %, mais ce qui est encore plus élevé que pour les autres groupes religieux.

Lire la source

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd