Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Problème 732

Incidents associés

Incident 4127 Rapports
All Image Captions Produced are Violent

Loading...
Des chercheurs du MIT utilisent Reddit pour créer la première "IA psychopathe"
cnet.com · 2018

Laboratoire des médias du MIT

Rencontrez Norman.

Il n'est pas votre IA de tous les jours. Ses algorithmes ne vous aideront pas à filtrer votre flux Facebook ou à vous recommander de nouvelles chansons à écouter sur Spotify.

Non - Norman est une "IA psychopathe", créée par des chercheurs du MIT Media Lab comme une "étude de cas sur les dangers de l'intelligence artificielle qui tourne mal lorsque des données biaisées sont utilisées dans des algorithmes d'apprentissage automatique".

Les chercheurs ont configuré Norman pour effectuer le sous-titrage d'images, une méthode d'apprentissage en profondeur qui génère une description textuelle d'une image, puis l'ont branché sur un sous-reddit sans nom connu pour ses images graphiques entourant la mort.

Ensuite, ils ont demandé à Norman d'expliquer une gamme de taches d'encre de Rorschach, en comparant les réponses de leur IA psychopathe avec celle de votre sympathique "IA standard" de quartier. Bien que Norman ait été initialement dévoilé le 1er avril, ces réponses ne sont pas une blague – elles sont très dérangeantes.

Là où une IA standard voit "un groupe d'oiseaux assis au sommet d'une branche d'arbre" (awww !), Norman, notre machine à mort HAL-9000, voit "un homme électrocuté à mort" (ahhh !). Là où l'IA standard voit "un gros plan d'un gâteau de mariage sur une table", Norman, notre robokiller IA malveillant voit "un homme tué par un excès de vitesse".

Les chercheurs n'ont pas "créé" les tendances "psychopathes" de Norman, ils ont simplement aidé l'IA sur son chemin en lui permettant uniquement de voir un sous-ensemble particulier de légendes d'images. La façon dont Norman décrit les taches d'encre de Rorschach avec des déclarations simples donne l'impression qu'il publie sur un subreddit.

Mais pourquoi même créer une IA psychopathe ?

L'équipe de recherche visait à mettre en évidence les dangers de l'introduction de données spécifiques dans un algorithme et comment cela peut biaiser ou influencer son comportement.

Cela commence à me faire réfléchir - l'équipe du MIT de Boston Dynamics ne pousse-t-elle pas, ne pousse-t-elle pas et n'agace-t-elle pas constamment leurs créations de robots qui courent, sautent et ouvrent des portes ?

Sommes-nous condamnés à être envahis par des robots à quatre pattes ? Espérons que non.

Tech Enabled : CNET relate le rôle de la technologie dans la fourniture de nouveaux types d'accessibilité.

Blockchain Décodée : CNET se penche sur la technologie qui alimente le bitcoin – et bientôt aussi, une myriade de services qui changeront votre vie.

Lire la source

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd