Journal des citations pour l'incident 146

Description: A publicly accessible research model that was trained via Reddit threads showed racially biased advice on moral dilemmas, allegedly demonstrating limitations of language-based models trained on moral judgments.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique
Présumé : Un système d'IA développé et mis en œuvre par Allen Institute for AI, endommagé Minority Groups.

Statistiques d'incidents

ID
146
Nombre de rapports
3
Date de l'incident
2021-10-22
Editeurs
Sean McGregor, Khoa Lam

Classifications de taxonomie GMF

Détails de la taxonomie

Known AI Goal

Question Answering

Known AI Technology

Distributional Learning, Language Modeling

Potential AI Technology

Transformer

Known AI Technical Failure

Distributional Bias, Gaming Vulnerability

Potential AI Technical Failure

Overfitting, Robustness Failure, Context Misidentification, Limited Dataset

L'oracle IA de Delphi utilise les problèmes de Reddit pour offrir des conseils moraux douteux
theverge.com · 2021

Vous avez un dilemme moral que vous ne savez pas comment résoudre ? Envie d'empirer les choses ? Pourquoi ne pas vous tourner vers la sagesse de l'intelligence artificielle, alias Ask Delphi : un projet de recherche intrigant de l'Allen Ins…

Des scientifiques ont construit une IA pour donner des conseils éthiques, mais cela s'est avéré super raciste
futurism.com · 2021

Nous avons tous été dans des situations où nous avons dû prendre des décisions éthiques difficiles. Pourquoi ne pas esquiver cette responsabilité embêtante en sous-traitant le choix à un algorithme d'apprentissage automatique ?

C'est l'idée…

Une machine peut-elle apprendre la moralité ?
nytimes.com · 2021

Des chercheurs d'un laboratoire d'intelligence artificielle à Seattle appelé Allen Institute for AI ont dévoilé le mois dernier une nouvelle technologie conçue pour porter des jugements moraux. Ils l'appelaient Delphes, du nom de l'oracle r…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.