Incidents associés

MISE À JOUR : 20 février 2013 à 10 h 35
Un chercheur de Harvard a découvert que les noms typiquement afro-américains sont plus susceptibles d'être liés à un casier judiciaire dans les publicités générées par Google sur le moteur de recherche en ligne et sur le site d'actualités Reuters.com, un site Web auquel Google fournit des publicités.
Latanya Sweeney, directrice du Data Privacy Lab à Harvard, a commencé ses recherches après qu'un collègue, Adam Tanner, un collègue du gouvernement, lui ait dit que sa recherche Google de son nom avait généré une publicité qui disait : « Latanya Sweeney : arrêtée ».
Incrédule, Sweeney a commencé à fouiller en ligne et a découvert que les publicités du site de casiers judiciaires InstantCheckmate.com suggéraient à tort qu'elle avait des antécédents d'arrestation. Les deux ont ensuite branché le nom de Tanner sur Google et, à la surprise du couple, cela a généré une annonce InstantCheckmate neutre qui ne faisait pas allusion à un casier judiciaire.
"Adam a sauté à la conclusion que [les publicités] arrivaient sur des noms à consonance noire", a déclaré Sweeney. "J'ai passé des heures à essayer de lui montrer qu'il avait tort et qu'il ne pouvait pas."
Publicité
Ainsi a commencé le début d'une étude de recherche, partiellement financée par Google, qui impliquait un vaste ratissage d'Internet et de nombreuses bases de données. Le document de recherche de Sweeney résumant ses découvertes devrait être publié dans une revue universitaire.
Tout d'abord, Sweeney a identifié des noms typiquement afro-américains à l'aide d'une base de données qui compilait les prénoms donnés de manière disproportionnée aux bébés d'une identité raciale par rapport à une autre. Elle a ensuite associé les prénoms aux noms de famille en identifiant de vrais professionnels titulaires de diplômes universitaires - des médecins, par exemple - et a vérifié leurs identités raciales avec les résultats de recherche Google Image. Enfin, à l'aide d'un échantillon de noms typiquement caucasiens et typiquement afro-américains, elle a effectué une analyse des résultats de recherche.
Selon Sweeney, Google soutient qu'il ne peut pas prédire quelles publicités - positives ou négatives - seront les plus populaires, donc les publicités sont initialement distribuées au hasard. Cependant, lors de recherches de noms typiquement afro-américains sur Google et Reuters.com, Sweeney a trouvé entre 81 et 95% des publicités générées suggérant une arrestation.
"C'est un miroir intéressant de la société", a déclaré Sweeney, "qu'Internet, qui a commencé neutre, a commencé à montrer des préjugés raciaux."
Lorsqu'on lui a demandé de commenter, le porte-parole de Google, Aaron J. Stein, a écrit dans un e-mail qu'AdWords, le produit publicitaire rentable de Google, ne se livre pas au profilage racial.
"Nous avons également une politique qui stipule que nous n'autoriserons pas les publicités qui plaident contre une organisation, une personne ou un groupe de personnes", a écrit Stein. "Il appartient aux annonceurs individuels de décider quels mots clés ils souhaitent choisir pour déclencher leurs annonces."
Reuters.com n'a pas pu être joint dans l'immédiat pour commenter l'étude de Sweeney mercredi soir.
Sweeney a déclaré qu'il y avait deux raisons possibles aux résultats apparemment biaisés : l'algorithme généré par ordinateur de Google peut être faussé involontairement, ou les utilisateurs de Google peuvent choisir de cliquer plus fréquemment sur les publicités d'arrestation qui présentent des noms noirs plutôt que des noms blancs.
Gary King, directeur de l'Institute for Qualitative Social Science à Harvard, a écrit dans un e-mail qu'isoler la cause des résultats de recherche biaisés déterminera les prochaines étapes pour les chercheurs.
"Établir les modèles, comme le fait Latanya, puis déterminer ses causes et ses effets, est très important", a écrit King.
— La rédactrice Anneli L. Tostar peut être contactée à annelitostar@college.harvard.edu, suivez-la sur Twitter à @annelitostar.