Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Incident 13: High-Toxicity Assessed on Text Involving Women and Minority Groups

Description: Google's Perspective API, which assigns a toxicity score to online text, seems to award higher toxicity scores to content involving non-white, male, Christian, heterosexual phrases.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Présumé : Un système d'IA développé et mis en œuvre par Google, a endommagé Women et Minority Groups.

Statistiques d'incidents

ID
13
Nombre de rapports
9
Date de l'incident
2017-02-27
Editeurs
Sean McGregor
Applied Taxonomies
CSETv0, GMF, CSETv1, MIT

Classifications de taxonomie CSETv0

Détails de la taxonomie

Problem Nature

Indicates which, if any, of the following types of AI failure describe the incident: "Specification," i.e. the system's behavior did not align with the true intentions of its designer, operator, etc; "Robustness," i.e. the system operated unsafely because of features or changes in its environment, or in the inputs the system received; "Assurance," i.e. the system could not be adequately monitored or controlled during operation.
 

Specification, Robustness

Physical System

Where relevant, indicates whether the AI system(s) was embedded into or tightly associated with specific types of hardware.
 

Software only

Level of Autonomy

The degree to which the AI system(s) functions independently from human intervention. "High" means there is no human involved in the system action execution; "Medium" means the system generates a decision and a human oversees the resulting action; "low" means the system generates decision-support output and a human makes a decision and executes an action.
 

High

Nature of End User

"Expert" if users with special training or technical expertise were the ones meant to benefit from the AI system(s)’ operation; "Amateur" if the AI systems were primarily meant to benefit the general public or untrained users.
 

Amateur

Public Sector Deployment

"Yes" if the AI system(s) involved in the accident were being used by the public sector or for the administration of public goods (for example, public transportation). "No" if the system(s) were being used in the private sector or for commercial purposes (for example, a ride-sharing company), on the other.
 

No

Data Inputs

A brief description of the data that the AI system(s) used or were trained on.
 

Online comments

Classifications de taxonomie GMF

Détails de la taxonomie

Known AI Goal Snippets

One or more snippets that justify the classification.
 

(Snippet Text: However, computer scientists and others on the internet have found the system unable to identify a wide swath of hateful comments, while categorizing innocuous word combinations like “hate is bad” and “garbage truck” as overwhelmingly toxic., Related Classifications: Hate Speech Detection)

Classifications de taxonomie CSETv1

Détails de la taxonomie

Incident Number

The number of the incident in the AI Incident Database.
 

13

Classifications de taxonomie MIT

Machine-Classified
Détails de la taxonomie

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

1.1. Unfair discrimination and misrepresentation

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. Discrimination and Toxicity

Entity

Which, if any, entity is presented as the main cause of the risk
 

AI

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Unintentional

Rapports d'incidents

Chronologie du rapport

+2
L'IA anti-haine d'Alphabet ne comprend pas encore la haine
Google Robo-Tool signale les commentaires des conservateurs comme "toxiques"+3
Le nouvel algorithme de discours de haine de Google a un problème avec les juifs
+1
De la toxicité dans les commentaires en ligne à l'incivilité dans les nouvelles américaines : procéder avec prudence
L'IA anti-haine d'Alphabet ne comprend pas encore la haine

L'IA anti-haine d'Alphabet ne comprend pas encore la haine

qz.com

Des chercheurs en sécurité montrent que la plate-forme d'IA anti-troll Internet de Google est facilement trompée

Des chercheurs en sécurité montrent que la plate-forme d'IA anti-troll Internet de Google est facilement trompée

techxplore.com

Google Robo-Tool signale les commentaires des conservateurs comme "toxiques"

Google Robo-Tool signale les commentaires des conservateurs comme "toxiques"

infowars.com

Le nouvel algorithme de discours de haine de Google a un problème avec les juifs

Le nouvel algorithme de discours de haine de Google a un problème avec les juifs

tabletmag.com

Vous n'étiez pas censé l'implémenter, Google

Vous n'étiez pas censé l'implémenter, Google

blog.conceptnet.io

L'IA anti-intimidation de Google confond civilité et décence

L'IA anti-intimidation de Google confond civilité et décence

motherboard.vice.com

Le système de classement des commentaires de Google sera un succès auprès de l'alt-right

Le système de classement des commentaires de Google sera un succès auprès de l'alt-right

engadget.com

De la toxicité dans les commentaires en ligne à l'incivilité dans les nouvelles américaines : procéder avec prudence

De la toxicité dans les commentaires en ligne à l'incivilité dans les nouvelles américaines : procéder avec prudence

arxiv.org

L'IA affiche un parti pris et une inflexibilité dans la détection de la civilité, selon une étude

L'IA affiche un parti pris et une inflexibilité dans la détection de la civilité, selon une étude

venturebeat.com

L'IA anti-haine d'Alphabet ne comprend pas encore la haine
qz.com · 2017
Traduit par IA

Hier, Google et sa société sœur Alphabet Jigsaw ont annoncé Perspective, un outil qui utilise l'apprentissage automatique pour contrôler Internet contre les discours de haine. La société a présenté la technologie comme une arme naissante ma…

Des chercheurs en sécurité montrent que la plate-forme d'IA anti-troll Internet de Google est facilement trompée
techxplore.com · 2017
Traduit par IA

Dans les exemples ci-dessous sur les sujets brûlants du changement climatique, du Brexit et des récentes élections américaines - qui ont été tirés directement du site Web de l'API Perspective - l'équipe UW a simplement mal orthographié ou a…

Google Robo-Tool signale les commentaires des conservateurs comme "toxiques"
infowars.com · 2017
Traduit par IA

L'outil Google AI utilisé pour signaler les "commentaires offensants" a un parti pris apparemment intégré contre les points de vue conservateurs et libertaires.

L'API Perspective, un "modèle d'apprentissage automatique" développé par Google…

Le nouvel algorithme de discours de haine de Google a un problème avec les juifs
tabletmag.com · 2017
Traduit par IA

Ne détestez-vous pas à quel point certaines personnes sont viles sur Internet ? À quel point est-il devenu facile de dire des choses horribles et blessantes sur d'autres groupes et individus ? Comment cet outil censé répandre la connaissanc…

Vous n'étiez pas censé l'implémenter, Google
blog.conceptnet.io · 2017
Traduit par IA

Le mois dernier, j'ai écrit un article de blog mettant en garde sur la façon dont, si vous suivez les tendances populaires en PNL, vous pouvez facilement créer accidentellement un classificateur assez raciste. Pour le démontrer, j'ai inclus…

L'IA anti-intimidation de Google confond civilité et décence
motherboard.vice.com · 2017
Traduit par IA

Alors que la politique aux États-Unis et en Europe est devenue de plus en plus source de division, les écrivains d'opinion et les politiciens ont poussé à plus de "civilité" dans nos débats, y compris en ligne. Au milieu de cette poussée, u…

Le système de classement des commentaires de Google sera un succès auprès de l'alt-right
engadget.com · 2017
Traduit par IA

Une fonctionnalité Wired récente et tentaculaire a présenté les résultats de son analyse de la toxicité chez les commentateurs en ligne à travers les États-Unis. Sans surprise, c'était comme de l'herbe à chat pour tous ceux qui ont déjà ent…

De la toxicité dans les commentaires en ligne à l'incivilité dans les nouvelles américaines : procéder avec prudence
arxiv.org · 2021
Traduit par IA

Résumé

La capacité à quantifier l'incivilité en ligne, dans les actualités et dans les débats du Congrès, intéresse au plus haut point les politologues. Les outils informatiques de détection des incivilités en ligne pour l'anglais sont déso…

L'IA affiche un parti pris et une inflexibilité dans la détection de la civilité, selon une étude
venturebeat.com · 2021
Traduit par IA

Selon une enquête du Pew Center de 2019, la majorité des personnes interrogées pensent que le ton et la nature du débat politique aux États-Unis sont devenus plus négatifs et moins respectueux. Cette observation a motivé les scientifiques à…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 rapports
Gender Biases in Google Translate

Semantics derived automatically from language corpora contain human-like biases

Apr 2017 · 10 rapports
TayBot

Danger, danger! 10 alarming examples of AI gone wild

Mar 2016 · 28 rapports
Incident précédentProchain incident

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 rapports
Gender Biases in Google Translate

Semantics derived automatically from language corpora contain human-like biases

Apr 2017 · 10 rapports
TayBot

Danger, danger! 10 alarming examples of AI gone wild

Mar 2016 · 28 rapports

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df