Incidents associés
Les systèmes de reconnaissance vocale ont plus de mal à comprendre les voix des utilisateurs noirs que celles des utilisateurs blancs, selon une nouvelle étude de Stanford.
Les chercheurs ont utilisé des outils de reconnaissance vocale d'Apple, d'Amazon, de Google, d'IBM et de Microsoft pour transcrire des entretiens avec 42 blancs et 73 noirs, qui ont tous eu lieu aux États-Unis. Les outils ont mal identifié les mots environ 19 % du temps lors des entretiens avec des Blancs et 35 % du temps lors des entretiens avec des Noirs. Le système a découvert que 2 % des extraits audio de Blancs étaient illisibles, contre 20 % de ceux de Noirs. Les erreurs étaient particulièrement importantes pour les hommes noirs, avec un taux d'erreur de 41 % contre 30 % pour les femmes noires.
Des recherches antérieures ont montré que la technologie de reconnaissance faciale présente un biais similaire. Une étude du MIT a révélé qu'un service de reconnaissance faciale d'Amazon n'a fait aucune erreur lors de l'identification du sexe des hommes à la peau claire, mais a obtenu de moins bons résultats lors de l'identification du sexe d'un individu s'il était une femme ou avait une peau plus foncée. Un autre article a identifié des préjugés raciaux et sexistes similaires dans les logiciels de reconnaissance faciale de Microsoft, IBM et de la société chinoise Megvii.
Dans l'étude de Stanford, le système de Microsoft a obtenu le meilleur résultat, tandis que celui d'Apple a obtenu le pire. Il est important de noter que ce ne sont pas nécessairement les outils utilisés pour créer Cortana et Siri, bien qu'ils puissent être régis par des pratiques et des philosophies d'entreprise similaires.
"L'équité est l'un de nos principes fondamentaux en matière d'IA, et nous nous engageons à progresser dans ce domaine", a déclaré un porte-parole de Google dans un communiqué à The Verge. "Nous avons travaillé sur le défi de reconnaître avec précision les variations de la parole pendant plusieurs années, et nous continuerons à le faire."
"IBM continue de développer, d'améliorer et de faire progresser nos capacités de traitement du langage naturel et de la parole pour apporter des niveaux croissants de fonctionnalités aux utilisateurs professionnels via IBM Watson", a déclaré un porte-parole d'IBM. Les autres sociétés mentionnées dans le document n'ont pas immédiatement répondu aux demandes de commentaires.
L'article de Stanford postule que l'écart racial est probablement le produit d'un biais dans les ensembles de données qui forment le système. Les algorithmes de reconnaissance apprennent en analysant de grandes quantités de données ; un robot formé principalement avec des clips audio de personnes blanches peut avoir des difficultés à transcrire un ensemble plus diversifié de voix d'utilisateurs.
Les chercheurs exhortent les fabricants de systèmes de reconnaissance vocale à collecter de meilleures données sur l'anglais vernaculaire afro-américain (AAVE) et d'autres variétés d'anglais, y compris les accents régionaux. Ils suggèrent que ces erreurs rendront plus difficile pour les Noirs américains de bénéficier d'assistants vocaux comme Siri et Alexa. La disparité pourrait également nuire à ces groupes lorsque la reconnaissance vocale est utilisée dans des contextes professionnels, tels que les entretiens d'embauche et les transcriptions des salles d'audience.