Incidents associés

Introduction L'expansion de la tenue de dossiers numériques par les services de police à travers les États-Unis dans les années 1990 a inauguré l'ère des services de police axés sur les données. D'immenses métropoles comme New York ont analysé des tonnes de données sur la criminalité et les arrestations pour trouver et cibler des «points chauds» pour une police supplémentaire. Les chercheurs de l'époque ont découvert que cela réduisait la criminalité sans nécessairement la déplacer vers d'autres parties de la ville, bien que certaines des tactiques utilisées, telles que l'arrêt et la fouille, aient finalement été critiquées par un juge fédéral, entre autres, comme des violations des droits civils. . Le prochain développement de la police basée sur les données a été arraché aux pages de la science-fiction : un logiciel qui promettait de prendre un fouillis de données sur la criminalité locale et de cracher des prévisions précises sur l'endroit où les criminels sont susceptibles de frapper ensuite, promettant d'arrêter le crime dans son élan. L'un des premiers, et apparemment le plus largement utilisé, est PredPol, son nom est un amalgame des mots "police prédictive". Le logiciel est dérivé d'un algorithme utilisé pour prédire les répliques de tremblements de terre qui a été développé par des professeurs de l'UCLA et publié en 2011. En envoyant des agents patrouiller ces points chauds prédits par algorithme, ces programmes promettent de dissuader les comportements illégaux. Mais les détracteurs des forces de l'ordre avaient leur propre prédiction : que les algorithmes enverraient des flics patrouiller dans les mêmes quartiers qu'ils disent que la police a toujours, ceux peuplés de personnes de couleur. Parce que le logiciel s'appuie sur des données sur la criminalité passée, ont-ils déclaré, il reproduirait les schémas enracinés des services de police et perpétuerait l'injustice raciale, en la recouvrant d'un vernis de science objective et axée sur les données. PredPol a déclaré à plusieurs reprises que ces critiques étaient hors de propos. L'algorithme n'intègre pas de données raciales, ce qui, selon la société, "élimine la possibilité de violations de la vie privée ou des droits civils observées avec d'autres modèles de police basés sur le renseignement ou prédictifs". Il y a eu peu d'examens empiriques indépendants des logiciels de police prédictive parce que les entreprises qui fabriquent ces programmes n'ont pas rendu publiques leurs données brutes. Une étude fondamentale basée sur les données sur PredPol publiée en 2016 n'impliquait pas de prédictions réelles. Au lieu de cela, les chercheurs, Kristian Lum et William Isaac, ont introduit des données sur la criminalité liée à la drogue d'Oakland, en Californie, dans l'algorithme open source de PredPol pour voir ce qu'il prédirait. Ils ont constaté que cela aurait ciblé de manière disproportionnée les quartiers noirs et latinos, malgré les données d'enquête qui montrent que les gens de toutes les races consomment de la drogue à des taux similaires. Les fondateurs de PredPol ont mené leurs propres recherches deux ans plus tard en utilisant les données de Los Angeles et ont déclaré avoir constaté que le taux global d'arrestations de personnes de couleur était à peu près le même, que le logiciel PredPol ou les analystes de la police humaine aient fait les prédictions des points chauds de la criminalité. Leur argument était que leur logiciel n'était pas pire en termes d'arrestations pour les personnes de couleur que la police non algorithmique. Cependant, une étude publiée en 2018 par une équipe de chercheurs dirigée par l'un des fondateurs de PredPol a montré que la population latino d'Indianapolis aurait subi "de 200% à 400% le nombre de patrouilles en tant que populations blanches" si elle y avait été déployée, et son Black la population aurait été soumise à « 150 % à 250 % du nombre de patrouilles par rapport aux populations blanches ». Les chercheurs ont déclaré qu'ils avaient trouvé un moyen de modifier l'algorithme pour réduire cette disproportion, mais que cela entraînerait des prédictions moins précises, bien qu'ils aient déclaré qu'il serait toujours "potentiellement plus précis" que les prédictions humaines. Dans des réponses écrites à nos questions, le PDG de la société a déclaré que la société n'avait pas modifié son algorithme en réponse à cette recherche, car la version alternative "réduirait la protection fournie aux quartiers vulnérables avec les taux de victimisation les plus élevés". Il a également déclaré que la société n'avait pas fourni l'étude à ses clients chargés de l'application des lois car il s'agissait "d'une étude universitaire menée indépendamment de PredPol". D'autres programmes de police prédictive ont également fait l'objet d'un examen minutieux. En 2017, le Chicago Sun-Times a obtenu une base de données de la liste des sujets stratégiques de la ville, qui utilisait un algorithme pour identifier les personnes risquant de devenir victimes ou auteurs de crimes violents liés aux armes à feu. Le journal a rapporté que 85 % des personnes que l'algorithme attribuait aux scores de risque les plus élevés étaient des hommes noirs, dont certains n'avaient aucun casier judiciaire violent. L'année dernière, le Tampa Bay Times a publié une enquête analysant la liste des personnes qui devaient commettre de futurs crimes par les outils prédictifs du bureau du shérif de Pasco. Des députés ont été dépêchés pour vérifier les personnes sur la liste plus de 12 500 fois. Le journal a rapporté qu'au moins une personne sur 10 figurant sur la liste était mineure et que nombre de ces jeunes n'avaient été arrêtés qu'une ou deux fois auparavant, mais avaient été soumis à des milliers de contrôles. Pour notre analyse, nous avons obtenu une mine de données de prévision de la criminalité PredPol qui n'ont jamais été publiées auparavant par PredPol pour une analyse universitaire ou journalistique non affiliée. Gizmodo l'a trouvé exposé sur le Web ouvert (le portail est maintenant sécurisé) et a téléchargé plus de 7 millions de prédictions de crimes PredPol pour des dizaines de villes américaines et certains endroits à l'étranger entre 2018 et 2021. Cela fait de notre enquête le premier effort indépendant pour examiner PredPol réel prédictions de la criminalité dans les villes du pays, apportant des faits quantitatifs au débat sur la police prédictive et sur la question de savoir si elle élimine ou perpétue les préjugés raciaux et ethniques. Nous avons examiné les prévisions dans 38 villes et comtés sillonnant le pays, de Fresno, en Californie, à Niles, dans l'Illinois, au comté d'Orange, en Floride, à Piscataway, dans le New Jersey. Nous avons complété notre enquête avec des données de recensement, y compris les identités raciales et ethniques et les revenus des ménages des personnes vivant dans chaque juridiction, à la fois dans les domaines ciblés par l'algorithme pour l'application et ceux qu'il ne ciblait pas. Dans l'ensemble, nous avons constaté que l'algorithme de PredPol ciblait sans relâche les groupes d'îlots de recensement dans chaque juridiction qui étaient les plus peuplés de personnes de couleur et de pauvres, en particulier ceux contenant des logements publics et subventionnés. L'algorithme a généré beaucoup moins de prédictions pour les groupes de blocs avec plus de résidents blancs. En analysant des juridictions entières, nous avons observé que la proportion de résidents noirs et latinos était plus élevée dans les groupes d'îlots les plus ciblés et plus faible dans les groupes d'îlots les moins ciblés (dont environ 10 % avaient des prédictions nulles) par rapport à l'ensemble de la juridiction. Nous avons également observé la tendance inverse pour la population blanche : les groupes d'îlots les moins ciblés contenaient une proportion plus élevée de résidents blancs que l'ensemble de la juridiction, et les groupes d'îlots les plus ciblés contenaient une proportion plus faible. Pour plus de la moitié (20) des juridictions dans nos données, la majorité des résidents blancs vivaient dans des groupes d'îlots ciblés moins que la médiane ou pas du tout. La même chose ne pouvait être dite que pour la population noire dans quatre juridictions et pour la population latino-américaine dans sept. Lorsque nous avons effectué une analyse statistique, elle a montré qu'à mesure que le nombre de prédictions de crimes pour les groupes de blocs augmentait, la proportion des populations noires et latino-américaines augmentait également et la population blanche diminuait. Nous avons également constaté que les prédictions de PredPol tombaient souvent de manière disproportionnée dans les endroits où vivent les habitants les plus pauvres. Pour la majorité des juridictions (27) de notre ensemble de données, une proportion plus élevée de ménages à faible revenu de la juridiction vit dans les groupes d'îlots les plus ciblés. Dans certaines juridictions, tous ses logements subventionnés et publics sont situés dans des groupes de blocs que PredPol a ciblés plus que la médiane. Nous nous sommes concentrés sur les groupes d'îlots de recensement, des grappes d'îlots qui ont généralement une population comprise entre 600 et 3 000 personnes, car il s'agissait des plus petites unités géographiques pour lesquelles des données récentes sur la race et le revenu étaient disponibles au moment de notre analyse (2018 American Community Survey). Les groupes de blocs sont plus grands que les carrés de prédiction de 500 x 500 pieds carrés produits par l'algorithme de PredPol. Par conséquent, les populations des grands groupes d'îlots pourraient être différentes des carrés de prédiction. Pour mesurer l'impact potentiel, nous avons effectué une analyse secondaire au niveau des blocs en utilisant les données du recensement de 2010 pour les blocs dont les populations sont restées relativement stables. (Voir Limites pour savoir comment nous définissons stable.) Nous avons constaté que dans près de 66% des 131 groupes de blocs stables, les prédictions se regroupaient sur les blocs avec le plus de résidents noirs ou latinos à l'intérieur de ces groupes de blocs. Un zoom sur les blocs a montré que les prédictions qui semblaient cibler les groupes de blocs à majorité blanche avaient en fait ciblé les blocs nichés à l'intérieur d'eux où vivaient davantage de Noirs et de Latinos. Cela était vrai pour 78% des 46 groupes de blocs stables à majorité blanche de notre échantillon. Pour essayer de déterminer les effets des prédictions PredPol sur la criminalité et la police, nous avons déposé plus de 100 demandes de dossiers publics et compilé une base de données de plus de 600 000 arrestations, interpellations policières et incidents de recours à la force. Mais la plupart des agences ont refusé de nous fournir des données. Seuls 11 ont fourni au moins certaines des données nécessaires. Pour les 11 départements qui ont fourni des données sur les arrestations, nous avons constaté que les taux d'arrestation dans les zones prévues restaient les mêmes, que PredPol ait prédit un crime ce jour-là ou non. En d'autres termes, nous n'avons pas trouvé de corrélation forte entre les arrestations et les prédictions. (Voir la section Limites pour plus d'informations sur cette analyse.) Nous ne savons pas avec certitude comment la police a agi sur une prédiction de crime individuelle, car presque tous les services de police nous ont refusé ces données. Un seul département a fourni plus de quelques jours de données simultanées extraites de PredPol indiquant quand la police a répondu aux prédictions, et ces données étaient si rares qu'elles soulevaient des questions sur leur exactitude. Pour déterminer si le ciblage de l'algorithme reflétait les schémas d'arrestation existants pour chaque département, nous avons analysé les statistiques d'arrestation par race pour 29 des agences dans nos données en utilisant les données du projet Uniform Crime Reporting (UCR) du FBI. Nous avons constaté que les caractéristiques socio-économiques des quartiers ciblés par l'algorithme reflétaient les schémas existants d'arrestations disproportionnées de personnes de couleur. Dans 90 % des juridictions, les arrestations par habitant étaient plus élevées pour les Noirs que pour les Blancs, ou pour tout autre groupe racial inclus dans l'ensemble de données. Cela correspond aux tendances nationales. (Voir Limites pour plus d'informations sur les données DUC.) Dans l'ensemble, notre analyse suggère que l'algorithme, au mieux, reproduisait la façon dont les agents ont exercé la police, et au pire, renforcerait ces schémas si ses recommandations en matière de police étaient suivies. Collecte et préparation des données Nous avons découvert l'accès aux données de prédiction PredPol via une page du site Web public du département de police de Los Angeles qui contenait une liste des zones de signalement PredPol avec des liens. Ces liens ont conduit à un espace de stockage cloud non sécurisé sur Amazon Web Services appartenant à PredPol qui contenait des dizaines de milliers de documents, y compris des fichiers PDF, des données géospatiales et des fichiers HTML pour des dizaines de départements, pas seulement le LAPD. Les données ont été laissées ouvertes et disponibles, sans demander de mot de passe pour y accéder. (L'accès a depuis été verrouillé.) Nous avons d'abord téléchargé toutes les données disponibles dans notre propre base de données le 8 juin 2020, à l'aide d'un outil de gestion du stockage en nuage développé par Amazon. Nous avons téléchargé à nouveau les données et mis à jour notre analyse le 31 janvier 2021. Cela a capturé un total de 7,8 millions de prédictions individuelles pour 70 juridictions différentes. Celles-ci prenaient la forme de cartes d'une seule page indiquant les adresses, chacune marquant le centre de boîtes de 500 par 500 pieds que le logiciel recommandait aux agents de patrouiller pendant des quarts de travail spécifiques pour dissuader le crime. Le code HTML de chaque rapport a été formaté avec la date, l'heure et le lieu de la prédiction. Cela nous a permis d'étudier les tendances dans les prédictions PredPol au fil du temps. Sur les 70 agences de notre ensemble de données, nous avions moins de six mois de prévisions pour 10 d'entre elles et six autres étaient des dossiers vides. Toutes les agences n'étaient pas basées aux États-Unis ou même des agences de police - certaines étaient des entreprises de sécurité privées. L'un utilisait PredPol pour prédire le vol de pétrole et d'autres crimes dans le champ pétrolifère de Boscán au Venezuela, tandis qu'un autre utilisait PredPol pour prédire les manifestations à Bahreïn. Bien que ces utilisations soulèvent des questions intéressantes, elles sortaient du cadre de notre enquête actuelle. Nous avons limité notre analyse aux agences d'application de la loi des villes et des comtés des États-Unis pour lesquelles nous disposions d'au moins six mois de données. Nous avons confirmé auprès de l'agence d'application de la loi, d'autres médias et/ou signé des contrats qu'ils avaient utilisé PredPol pendant la période pour laquelle nous avions des rapports et les dates d'arrêt et de début pour chaque ville. Cela a réduit la liste à 38 agences. Pour 20 de ces 38 départements, certaines prévisions de nos données se situaient en dehors des dates d'arrêt/de début fournies par les forces de l'ordre. Nous avons donc supprimé ces prévisions des données finales utilisées pour notre analyse, avec beaucoup de prudence. L'ensemble de données final que nous avons utilisé pour l'analyse contenait plus de 5,9 millions de prédictions. Pour déterminer quelles communautés ont été sélectionnées pour une patrouille supplémentaire par le logiciel, nous avons collecté des informations démographiques auprès du Bureau du recensement pour l'ensemble de la juridiction de chaque département, et pas seulement les emplacements de prédiction. Pour les services de police, nous avons supposé que leurs juridictions incluaient chaque groupe d'îlots de la ville, une limite officielle que le recensement appelle un « lieu désigné par le recensement ». (Voir plus dans la section Limitations.) Les départements du shérif étaient plus compliqués car, dans certains cas, leur comté d'origine comprend des villes qu'ils ne patrouillent pas. Pour ceux-ci, nous avons obtenu les cartes de patrouille des départements du shérif et utilisé un outil en ligne appelé Census Reporter pour compiler une liste de chaque groupe de blocs dans la juridiction divulguée. Nous avons recherché les secteurs de recensement et les groupes d'îlots pour les coordonnées de chaque prédiction dans notre base de données à l'aide de l'API de géocodage du recensement. Les secteurs de recensement et les groupes d'îlots utilisés dans notre analyse ont été tirés au cours du Recensement de 2010. Nous avons recueilli des données démographiques pour ces zones à partir des estimations de la population sur cinq ans dans l'American Community Survey (ACS) de 2018, l'enquête la plus récente disponible lorsque nous avons commencé notre enquête. L'ACS ne fournit des informations démographiques que jusqu'au niveau du groupe d'îlots - les subdivisions d'un secteur de recensement qui comprennent généralement entre 600 et 3 000 personnes et occupent en moyenne 39 blocs. Celles-ci sont nettement plus grandes que les boîtes de prédiction, qui mesurent à peine six acres ou environ la taille d'un pâté de maisons carré, mais nous n'avions pas de bonne alternative. Les données démographiques plus petites au niveau des blocs du Bureau du recensement pour 2020 ne devraient pas être publiées avant 2022. Les données au niveau des blocs disponibles au cours de notre enquête datent de plus de 10 ans, et nous avons constaté que les changements démographiques depuis lors dans la majorité des groupes de blocs dans nos données étaient significatifs (30 % ou plus pour les populations noires, latinos ou blanches des groupes de blocs). (Voir plus dans la section Limitations.) La superposition des données du recensement ACS de 2018 nous a permis d'effectuer une analyse d'impact disparate sur les personnes qui vivaient dans les zones ciblées par le logiciel PredPol à l'époque - et celles qui vivaient dans des zones qui n'étaient pas ciblé. Méthodes d'analyse des prévisions et des résultats Compte tenu de la quantité et des divers types de données que nous avons recueillies, nous avons utilisé diverses méthodes d'analyse pour cette enquête, chacune d'entre elles étant décrite en détail dans les sections suivantes. Nous avons effectué plusieurs analyses d'impact disparates visant à discerner si les prévisions pesaient plus lourdement sur les communautés de couleur, les communautés à faible revenu et les blocs contenant des logements sociaux. Pour les analyses de race/ethnicité et de revenu, nous avons fusionné les données de l'American Community Survey de 2018 et les données de prédiction et observé la composition des groupes de blocs ciblés au-dessus et au-dessous de la médiane ; ceux qui sont le plus ciblés ; et ceux qui sont le moins ciblés. (Nous avons également analysé les données de manière continue pour confirmer que nos résultats étaient dus à une tendance sous-jacente, et non à de fausses observations.) Nous avons également effectué une analyse d'impact disparate limitée à une échelle plus petite, au niveau du bloc, en utilisant les données du recensement de 2010. Pour l'analyse d'impact disparate sur le logement public, nous avons recueilli des données publiées par le ministère fédéral du Logement et du Développement urbain sur l'emplacement des logements subventionnés et publics dans toutes les juridictions de nos données, les avons cartographiés et observé la fréquence des prévisions PredPol pour ces emplacements. Pour examiner les relations possibles entre les prédictions et les actions des forces de l'ordre, nous avons analysé plus de 270 000 dossiers d'arrestation de 11 agences, 333 000 arrêts de piétons ou de circulation de huit agences et 300 dossiers de recours à la force de cinq agences, qui ont tous été rendus publics. enregistre les lois. (La plupart des agences n'ont pas fourni de dossiers.) Nous avons également examiné les taux d'arrestation par race / origine ethnique pour 29 des 38 juridictions de notre ensemble de données final en utilisant les données du programme Uniform Crime Reporting du FBI. Enfin, six agences ont fourni des données désagrégées sur les arrestations qui incluaient la race, et nous avons examiné ces données pour discerner les taux d'arrestation parmi les groupes raciaux pour certains types de crimes, tels que la possession de cannabis. Analyse d'impact disparate Les contacts fréquents avec la police, comme l'exposition fréquente à un polluant, peuvent avoir un effet néfaste sur les individus et entraîner des conséquences qui s'étendent à des communautés entières. Une étude de 2019 publiée dans l'American Sociological Review a révélé que l'augmentation des services de police dans des points chauds ciblés à New York dans le cadre de l'opération Impact réduisait les performances scolaires des garçons noirs de ces quartiers. Une autre étude de 2019 a révélé que plus les jeunes garçons sont arrêtés par la police, plus ils sont susceptibles de déclarer avoir eu un comportement délinquant six, 12 et 18 mois plus tard. Nous avons effectué une analyse d'impact disparate pour évaluer quels groupes démographiques, le cas échéant, seraient exposés de manière disproportionnée à des interactions potentielles avec la police si les agences avaient agi sur les recommandations fournies par le logiciel de PredPol. Nous avons analysé la distribution des prédictions PredPol pour chaque juridiction au niveau géographique d'un groupe d'îlots de recensement, qui est un groupe d'îlots avec une population de 600 à 3 000 personnes, en général. Les groupes d'îlots dans nos données étaient composés de 28 îlots, en moyenne, et contenaient en moyenne 1 600 résidents. Comme indiqué précédemment, ceux-ci étaient beaucoup plus grands que les carrés de prédiction de 500 par 500 pieds de PredPol, mais sont la plus petite unité géographique pour laquelle des informations gouvernementales récentes sur la race, l'origine ethnique et le revenu du ménage de ses habitants étaient disponibles au moment de notre enquête. . Il y avait une variation significative dans la durée pendant laquelle chacune des 38 juridictions de notre analyse a utilisé le logiciel pendant notre fenêtre d'accès, et quels crimes ils l'ont utilisé pour prédire. Il y avait également une énorme différence dans le nombre moyen de prédictions sur les groupes d'îlots entre les juridictions, qui variait de huit à 7 967. Les 38 juridictions étaient de tailles diverses ; Jacksonville, Texas, était le plus petit, avec 13 groupes de blocs, et Los Angeles le plus grand, avec 2 515 groupes de blocs. Nous avons calculé le nombre total de prédictions par groupe d'îlots dans chaque juridiction. Nous avons ensuite trié les groupes d'îlots dans chaque juridiction en fonction de leur nombre de prédictions et créé trois catégories pour l'analyse. Nous avons défini les « groupes d'îlots les plus ciblés » comme ceux de chaque juridiction qui comprenaient les 5 % de prédictions les plus élevées, ce qui correspondait à entre un et 125 groupes d'îlots. Nous avons défini les « groupes d'îlots ciblés médians » comme les 5 % des groupes d'îlots de chaque juridiction chevauchant le groupe d'îlots médian pour les prévisions. Et nous avons défini les « groupes d'îlots les moins ciblés » comme les groupes d'îlots de chaque juridiction avec les 5 % de prédictions les plus faibles. Nous avons également calculé si la majorité (plus de 50 %) du groupe démographique d'une juridiction vivait dans les blocs de groupes ciblés plus ou moins que la médiane. Nous avons choisi de définir les groupes les plus ciblés et les moins ciblés en utilisant la métrique de 5 % plutôt que d'utiliser des méthodes alternatives, telles que l'intervalle interquartile (IQR). Avec la méthode IQR, nous considérerions les groupes de blocs en dessous du 25e centile comme les moins ciblés et les groupes de blocs au-dessus du 75e centile comme les plus ciblés, mais cela ne correspondait pas à nos exigences en raison du grand volume de groupes de blocs à prédiction zéro. (dix%). En utilisant la méthode IQR, le pourcentage moyen des groupes d'îlots d'une juridiction dans le groupe le plus ciblé aurait été de 7 % des groupes d'îlots de la juridiction, tandis que la moyenne dans le groupe le moins ciblé aurait représenté 71 % des groupes d'îlots de la juridiction . Cette différence est trop grande pour permettre une comparaison significative de la composition démographique des groupes d'îlots les moins ciblés et les plus ciblés. C'est pourquoi nous avons choisi d'utiliser 5 % pour les groupes les moins et les plus ciblés. Dans certaines des plus grandes juridictions, plus de 5 % des groupes d'îlots n'ont reçu aucune prédiction. Dans ces cas, nous avons choisi les groupes de blocs les plus peuplés sans prédictions pour les 5 %. Nous avons également effectué une analyse dans laquelle nous avons compté chaque groupe de blocs avec des prédictions nulles comme les groupes de blocs les moins ciblés, et les résultats n'ont pas changé de manière significative. (Voir Limites pour plus d'informations.) L'analyse comprenait les étapes suivantes : 1. Trier la liste des groupes de blocs du plus ciblé au moins ciblé et étiqueter le plus ciblé, le médian ciblé ou le moins ciblé comme défini ci-dessus. 2. Obtenez les données de population ACS au niveau du groupe de blocs pour les populations démographiques suivantes : a) Race : Afro-américain, Asiatique, Latino et Blanc. b) Revenu du ménage : moins de 45 000 $, 75 000 $ à 100 000 $, 125 000 $ à 150 000 $, supérieur à 200 000 $ Nous calculons donc 3×38 valeurs de dt : 4. Calculez la proportion pour chaque groupe démographique d, dans tous les groupes d'îlots de la juridiction j. Cela nous donne 38 valeurs pour dj : 5. Pour déterminer si la proportion d'un groupe démographique dans les blocs les plus ciblés, médians ou les moins ciblés est supérieure à ce qu'elle est dans l'ensemble de la juridiction, nous comparons simplement les valeurs. Pour chaque juridiction, nous comparons les trois valeurs de dt à dj. Nous présentons les résultats agrégés pour toutes les juridictions : 6. Nous avons également calculé quelle proportion du groupe démographique d d'une juridiction vivait dans les groupes d'îlots ciblés plus et moins que la médiane : 7. À l'aide de ces valeurs, nous pouvons calculer le nombre de juridictions où le groupe démographique la majorité vit dans les blocs les plus et les moins ciblés. Après avoir effectué les comparaisons individuellement pour chaque juridiction, nous présentons les résultats agrégés. Nous avons acquis des données démographiques sur les groupes de blocs de l'American Community Survey 2018 du Census Bureau. Nous avons effectué notre analyse pour la race/ethnicité et le revenu du ménage. Toutes les juridictions ne disposaient pas d'estimations fiables au niveau du groupe d'îlots pour chaque groupe racial ou de revenu, car certaines populations étaient trop petites. Pour notre analyse principale, nous nous sommes concentrés sur la composition démographique des blocs les plus et les moins ciblés ainsi que ceux ciblés plus que la médiane et moins que la médiane. Cela nous a permis de mesurer l'impact disparate d'une manière claire mais simple à comprendre. Afin de nous assurer que nous n'étions pas en train de trier les statistiques, nous avons également effectué une analyse qui préservait le caractère continu des données. Pour chacune de nos 38 juridictions, nous avons examiné la relation entre les paires de variables suivantes au niveau du groupe d'îlots de recensement : nombre de prédictions et population de race (asiatique, afro-américaine, latino et blanche) nombre de prédictions et nombre de ménages à différentes tranches de revenu (plus de 200 000 $, entre 125 000 $ et 150 000 $, entre 75 000 $ et 100 000 $ et moins de 45 000 $). Nous avons calculé le coefficient de corrélation de Spearman et utilisé une boîte à moustaches pour visualiser la distribution des coefficients de corrélation pour chaque paire de variables et calculé les valeurs médianes des coefficients dans les 38 juridictions. Cette analyse nous a permis de mesurer si, pour une juridiction donnée, le nombre de prédictions qu'un groupe bloc a reçu est corrélé à la race/ethnicité ou au revenu des personnes qui y vivent. Nous avons choisi de calculer des coefficients individuels pour chaque juridiction, plutôt que de regrouper tous les groupes d'îlots dans toutes les juridictions en une seule analyse puisqu'il s'agit de distributions indépendantes. Il pourrait y avoir des différences significatives entre les pratiques policières des juridictions, et il existe certainement des variations importantes dans le nombre de groupes de blocs et la composition raciale et du revenu du ménage des personnes vivant dans chacun d'eux, ainsi que le nombre total de prédictions qu'ils ont reçues. Pour cette raison, nous avons analysé chaque juridiction individuellement et examiné la distribution de ces coefficients de corrélation pour voir si une tendance se dégageait. Pour notre analyse finale, nous avons examiné la composition démographique des 38 juridictions individuellement en regroupant les groupes d'îlots en tranches discrètes en fonction du nombre de prédictions qu'ils ont reçues. Nous avons créé 10 bacs de taille égale en fonction du score centile d'un groupe d'îlots dans une juridiction donnée. Le premier groupe avait des groupes de blocs qui avaient entre 0 prédictions et le 10e centile, et le dernier groupe avait des groupes de blocs qui étaient entre le 90e et le 100e centile. Nous avons ensuite calculé la composition démographique de la collection de groupes d'îlots dans chacun de ces bacs. Cela nous a permis d'observer s'il existait une relation entre la composition des groupes raciaux/ethniques ou de revenu dans chacun de ces bacs et les prédictions reçues. Contrairement à notre analyse précédente, cette méthode inclut tous les groupes d'îlots dans chaque juridiction. Nous présentons les résultats moyens dans toutes les juridictions dans les deux sections suivantes et fournissons les résultats pour les juridictions individuelles dans notre GitHub. Afin de mesurer l'exactitude de nos résultats, nous avons utilisé la marge d'erreur des estimations de population présentes dans les données de l'ACS de 2018 pour exécuter notre analyse sur les limites inférieure et supérieure des estimations de population de chaque groupe d'îlots. Cela nous a permis de mesurer à quel point nos résultats variaient en raison des inexactitudes des données de l'ACS. Il n'y a pas eu de changement significatif dans nos résultats pour les populations afro-américaines, asiatiques, latino-américaines ou blanches, ou pour différentes tranches de revenu médian des ménages, quelle que soit l'estimation de population que nous avons utilisée. Pour pécher par excès de prudence tout au long de cette méthodologie, nous énonçons nos conclusions avec la plus faible des trois valeurs que nous avons calculées (par exemple, « au moins 63 % des juridictions »). Le seul groupe démographique pour lequel les résultats variaient de manière significative était les Amérindiens, nous n'avons donc pas utilisé ces résultats dans notre analyse. Pour déterminer si le fait de se concentrer sur une zone géographique plus petite affecterait nos résultats, nous avons effectué une analyse secondaire au niveau du bloc en utilisant les données de 2010 et avons trouvé des disparités encore plus importantes (plus dans la section suivante et Limites). Analyse raciale et ethnique Groupes d'îlots les plus et les moins ciblés Pour la majorité des juridictions que nous avons analysées, les groupes d'îlots les plus ciblés avaient une population noire ou latino-américaine plus élevée, tandis que les groupes d'îlots qui n'étaient jamais ou rarement ciblés avaient tendance à avoir une population blanche plus élevée lorsque par rapport à la juridiction dans son ensemble. Dans une majorité de 38 juridictions, plus de Noirs et de Latinos vivaient dans les groupes de blocs les plus ciblés, tandis que davantage de Blancs vivaient dans ceux qui étaient les moins ciblés. Dans au moins 84 % des départements (32), une proportion plus élevée de résidents noirs ou latinos vivaient dans les groupes d'îlots les plus ciblés par rapport à l'ensemble de la juridiction. En ne regardant que les résidents noirs, une proportion plus élevée vivait dans les groupes d'îlots les plus ciblés dans 66% des juridictions (25), et pour les Latinos seuls, c'est 55% des juridictions (21). Ce même phénomène était moins fréquent chez les résidents asiatiques. Dans au moins 34 % des juridictions (13), les populations asiatiques des groupes d'îlots les plus ciblés dépassent la population asiatique médiane de la juridiction. C'était le moins courant pour les Blancs. Dans au moins 21 % des juridictions (8), une proportion plus élevée de résidents blancs vivent dans les groupes d'îlots les plus ciblés par le logiciel de PredPol que la juridiction dans son ensemble. À l'inverse, lorsque nous avons examiné les groupes de blocs les moins ciblés par le logiciel de PredPol, leurs données démographiques étaient inversées. Pour au moins 74 % des services de police dans nos données (28 juridictions), la proportion de résidents blancs dans les groupes d'îlots les moins ciblés était supérieure à celle de l'ensemble de la juridiction. Cela était vrai pour les Noirs et les Latinos beaucoup moins souvent, dans au moins 16 % (6) et 18 % (7) des juridictions, respectivement. En analysant les blocs les plus ciblés des 38 juridictions, nous avons constaté que la proportion d'Afro-américains et de Latinos avait augmenté de 28 % et 16 % en moyenne, et que la population blanche moyenne avait diminué de 17 %. La tendance inverse était vraie pour les blocs les moins ciblés. À mesure que les prévisions augmentaient, la proportion de Noirs et de Latinos dans les groupes de blocs augmentait. L'inverse était vrai pour les Blancs. À Salisbury, Maryland, au moins 26% des résidents du groupe d'îlots médians de la juridiction sont noirs, selon le Census Bureau. Cependant, la population noire a bondi à au moins 5%, en moyenne, pour les groupes de blocs les plus ciblés par PredPol. À Portage, dans le Michigan, les groupes d'îlots les plus ciblés comptaient au moins neuf fois plus de résidents noirs que les groupes d'îlots ciblés médians de la ville et au moins sept fois plus de résidents noirs que la ville dans son ensemble. Et le nombre de prédictions dans ces zones les plus ciblées était souvent écrasant. Dans un groupe d'îlots à Jacksonville, au Texas (groupe d'îlots 1 du secteur de recensement 950500), PredPol a prédit qu'une agression ou un cambriolage de véhicule se produirait à l'un des divers endroits de ce groupe d'îlots 12 187 fois sur près de deux ans. C'est 19 prédictions chaque jour dans une région avec une population de 1 810 personnes. La population de ce groupe de blocs est composée d'au moins 62 % de Noirs et de Latinos et entre 15 % et 21 % de Blancs. En fait, au moins 83% de la population noire de Jacksonville vivait dans des groupes de blocs qui ont été ciblés plus de 7 500 fois en deux ans. C'était plusieurs fois plus que le pourcentage de la population blanche de la ville qui vivait dans ces groupes d'îlots (au moins 23%). Lorsque nous avons interrogé PredPol à ce sujet, la société a déclaré que Jacksonville utilisait le logiciel de manière abusive pendant une partie du temps, en utilisant trop de quarts de travail quotidiens, ce qui entraînait des prévisions supplémentaires par jour. (Voir plus dans la section Réponse de l'entreprise.) La police de Jacksonville n'a pas répondu aux demandes de commentaires. Groupes de blocs au-dessus et en dessous de la médiane Nous avons également constaté que pour au moins 76 % des juridictions dans nos données (29), la majorité de la population noire ou latino d'une juridiction vivait dans les groupes de blocs ciblés par PredPol plus que la médiane. Une majorité de résidents asiatiques vivaient dans ces groupes d'îlots pour au moins 55 % des juridictions dans nos données. L'algorithme a largement épargné aux résidents blancs le même niveau de contrôle qu'il recommandait pour les résidents noirs et latinos. Pour plus de la moitié (20) des juridictions dans nos données, la majorité des résidents blancs vivaient dans des groupes d'îlots ciblés moins que la médiane ou pas du tout. La même chose ne pouvait être dite que pour la population noire dans quatre juridictions et pour la population latino-américaine dans sept. Analyse de course au niveau du bloc Les partisans de la police des points chauds soulignent que la petite taille de la zone de prédiction est cruciale. Pour déterminer si le fait de se concentrer sur une zone géographique plus petite aurait une incidence sur nos résultats, nous avons effectué une analyse secondaire au niveau de l'îlot à l'aide des données du recensement de 2010. Pour réduire les effets des déplacements de population au cours de la décennie suivante, nous avons limité cette analyse aux groupes de blocs avec au moins une prédiction dans notre ensemble de données où les populations noires, latino-américaines et blanches n'ont pas changé de plus de 20 % entre le recensement de 2010 et l'ACS de 2018. . Les populations asiatiques et amérindiennes étaient trop petites pour cette analyse secondaire. Pour notre ensemble de données, 20 % s'est avéré être un bon seuil pour sélectionner des groupes d'îlots où les changements démographiques de population étaient faibles. Dans les 135 groupes de blocs raisonnablement stables résultants (2 % des groupes de blocs dans nos données), nous avons constaté que 89 des blocs ciblés en leur sein avaient des concentrations encore plus élevées de résidents noirs et latinos que le groupe de blocs global. (Voir plus dans la section Limitations.) Dans certains cas, un zoom avant sur les blocs a montré que les prédictions qui semblaient cibler les groupes de blocs blancs majoritaires avaient en fait ciblé les blocs en leur sein où vivaient des personnes de couleur. Par exemple, chaque prédiction dans un groupe de blocs majoritairement blanc dans le quartier Northridge de Los Angeles (groupe de blocs 2 du secteur de recensement 115401) s'est produite sur un bloc dont les habitants étaient presque tous latinos. Le bloc le plus ciblé d'un groupe de blocs à majorité blanche à Elgin, Illinois. (groupe d'îlot 1 du secteur de recensement 851000), comptait sept fois plus de résidents noirs que le reste du groupe d'îlot. Pour 36 (78%) des 46 groupes de blocs stables à majorité blanche, les prédictions ciblaient le plus souvent les blocs à l'intérieur d'eux qui avaient des pourcentages plus élevés de résidents noirs ou latinos. Dans seulement 18 (36%) des 50 groupes de blocs stables, majoritairement noirs et hispaniques, les blocs les plus ciblés avaient des pourcentages plus élevés de Blancs que le groupe de blocs dans son ensemble. Corrélation entre les prédictions et la race Nous avons analysé la relation entre le volume de prédictions reçues par un groupe bloc et sa composition raciale et ethnique à l'aide du coefficient de corrélation de Spearman. Nous avons calculé le coefficient de corrélation pour les 38 juridictions individuellement. Pour chaque juridiction, nous avons calculé quatre coefficients, un pour chaque race/ethnicité dans notre analyse. Ainsi, nous avions 38 × 4 coefficients. Nous avons visualisé la distribution pour mettre en évidence la tendance sous-jacente. Les données suggèrent qu'à mesure que le nombre de prédictions dans un groupe de blocs augmente, la proportion de Noirs et de Latinos de la population augmente et la proportion de Blancs et d'Asiatiques de la population diminue. Bien que la corrélation médiane soit faible, il existe de nombreuses variations. Cela peut être dû au fait que l'algorithme fait écho aux pratiques policières existantes ou parce que certaines juridictions dans les données sont beaucoup plus séparées que d'autres. Comme mentionné précédemment, les boîtes de prédiction de PredPol sont beaucoup plus petites qu'un groupe de blocs. Étant donné que les coefficients de corrélation sont calculés au niveau du groupe d'îlots, ils ne prendraient pas le type de ciblage que nous décrivons dans la section précédente, où même au sein de certains groupes d'îlots à majorité blanche, les blocs les plus ciblés étaient ceux où les gens de couleur vivaient. Ainsi ces coefficients de corrélation sont plus conservateurs que celui effectué au niveau d'un îlot de recensement. Nous n'avons pas été en mesure d'effectuer cette analyse à ce niveau plus granulaire en raison des limites des données démographiques du recensement au niveau des blocs dont nous disposons. À mesure que le nombre de prédictions dans un groupe de blocs augmentait, la proportion de Noirs et de Latinos dans la population augmentait. Composition raciale/ethnique des déciles groupes de blocs dans des compartiments discrets en fonction du nombre de prédictions qu'ils ont reçues et calculé la proportion des groupes de race/ethnicité et de revenu dans notre analyse qui vivaient dans la collection de groupes de blocs dans chaque compartiment. Après avoir calculé ces valeurs pour chacune de nos 38 juridictions individuellement, nous avons calculé la valeur moyenne pour chaque compartiment dans toutes les juridictions. Ceci est illustré dans le tableau ci-dessous. La figure montre qu'en moyenne, à mesure que le nombre de prédictions reçues par un groupe de blocs augmente, la proportion des populations noires et latino-américaines augmente et la population blanche diminue. Les quartiers avec le plus de prédictions avaient la plus faible proportion de résidents blancs. Notre analyse a montré que les groupes d'îlots les plus ciblés avaient une population noire ou latino-américaine plus élevée que la juridiction dans son ensemble, tandis que les groupes d'îlots qui n'étaient jamais ou rarement ciblés avaient tendance à avoir un pourcentage plus élevé de résidents blancs que la juridiction dans son ensemble. Pour voir comment la composition démographique a changé pour une juridiction individuelle, consultez notre GitHub ici. Analyse de la richesse et de la pauvreté La combinaison des données de prédiction avec les données de l'enquête sur la communauté américaine de 2018 du Census Bureau nous a également donné un aperçu des strates financières de ceux qui vivent dans les zones ciblées par PredPol. Le seuil de pauvreté fédéral, à 26 200 dollars par an pour une famille de quatre personnes, est largement critiqué comme une mesure trop basse pour fournir une image précise de toutes les personnes souffrant d'insécurité financière et alimentaire en Amérique. Pour capturer un éventail plus large de familles à faible revenu que le seuil de pauvreté ne le permet, nous avons choisi une mesure fédérale différente : le seuil de revenu permettant aux élèves des écoles publiques de se qualifier pour le programme fédéral de repas gratuits et réduits, qui est de 48 000 $ par an pour une famille de quatre personnes. . Nous avons arrondi à 45 000 $ parce que c'était aussi proche que les données du recensement pouvaient nous donner. Dans nos 38 juridictions, nous avons observé une variation significative dans la tranche de revenu supérieure. Certains n'avaient presque aucun ménage gagnant plus de 200 000 $, tandis que pour d'autres, ils représentaient 15 % de la juridiction. Pour tenir compte de la variation, nous avons utilisé trois tranches de revenu supérieures différentes pour essayer de saisir les quartiers les plus riches dans différentes municipalités. Ces plages ont été choisies en utilisant ce qui était disponible dans le tableau du recensement pour le revenu des ménages au cours des 12 derniers mois. Nous avons compté le nombre de ménages dans chaque groupe d'îlot de recensement ayant un revenu annuel de 45 000 $ ou moins ainsi que les regroupements suivants : 75 000 $ à 100 000 $, 125 000 $ à 150 000 $ et plus de 200 000 $. Nous avons ensuite calculé quel pourcentage de la part de chaque juridiction de ces groupes de revenu était située dans des groupes de blocs dans les zones les plus, médianes et les moins ciblées pour les prédictions PredPol, comme nous l'avions fait pour l'analyse raciale et ethnique. Groupes d'îlots les plus et les moins ciblés Notre analyse a révélé que, par rapport à l'ensemble de la juridiction, une proportion plus élevée de ménages à faible revenu d'une juridiction vivaient dans les groupes d'îlots les plus ciblés par le logiciel PredPol, et une proportion plus élevée de ménages de la classe moyenne et les ménages aisés vivaient dans les groupes d'îlots qu'ils ciblaient le moins. Dans au moins 71 % des juridictions (27) de notre ensemble de données, une proportion plus élevée de ménages à faible revenu (revenu annuel de 45 000 $ ou moins) vivaient dans les groupes d'îlots les plus ciblés par le logiciel de PredPol par rapport à la juridiction dans son ensemble. Cela était vrai pour les ménages qui gagnaient plus de 200 000 $ dans au moins 21 % des juridictions (8). Dans 30 juridictions, les groupes d'îlots les plus ciblés avaient des ménages plus pauvres. En examinant les blocs les plus ciblés dans les 38 juridictions de notre ensemble de données, la proportion de ménages qui gagnaient moins de 45 000 $ en moyenne a augmenté de 18 %, et la proportion moyenne de ménages qui gagnaient plus de 200 000 $ a diminué de 26 %. La tendance inverse était vraie pour les blocs les moins ciblés. À mesure que les prévisions augmentaient, les ménages les plus pauvres augmentaient et les ménages riches diminuaient. Dans certains endroits, la disparité était encore plus dramatique. À Haverhill, Massachusetts, par exemple, au moins 21 % des 4 503 ménages à faible revenu de la juridiction étaient situés dans les groupes d'îlots les plus ciblés. À Decatur, en Géorgie, au moins un sur trois (34 %) des ménages à faible revenu de la juridiction vivaient dans deux groupes de blocs que PredPol ciblait constamment – plus de 11 000 prédictions chacun sur près de trois ans. Nous avons également examiné la répartition des ménages les plus riches dans les juridictions et les avons comparées aux prévisions de PredPol. Nous avons constaté que les groupes de blocs qui n'étaient jamais ciblés avaient tendance à être plus riches. Pour la majorité des juridictions dans nos données, les groupes d'îlots de recensement que PredPol ciblait le moins étaient composés de plus de ménages gagnant au moins 200 000 $ par an que dans l'ensemble de la juridiction. À Merced, en Californie, par exemple, les groupes d'îlots les moins ciblés comptaient en moyenne au moins 10 ménages aisés. Les groupes de blocs ciblés par la médiane n'en avaient aucun. Et à Birmingham, en Alabama, le groupe de blocs médian n'avait pas un seul ménage riche. Mais les groupes de blocs où PredPol n'a jamais fait de prédictions comptaient au moins 34 ménages plus riches en moyenne. Pour voir comment la composition démographique des quartiers a changé dans une juridiction individuelle en fonction du ciblage du logiciel, consultez notre GitHub ici. Groupes d'îlots au-dessus et en dessous de la médiane Nous avons également constaté que pour 33 juridictions (87 %), la majorité des ménages à faible revenu de la juridiction se trouvaient dans les groupes d'îlots ciblés plus que la médiane. Dans seulement 13 juridictions (34 %), la majorité des ménages gagnant 200 000 $ ou plus vivaient dans des groupes d'îlots ciblés plus que la médiane. Corrélation entre les prédictions et le revenu Nous avons analysé la relation entre le volume de prédictions qu'un groupe bloc a reçu et la fourchette de revenus des personnes qui y vivent. Pour chaque juridiction, nous avons calculé quatre coefficients, un pour chaque tranche de revenu dans notre analyse. Ainsi, nous avions 38 × 4 coefficients. Nous avons visualisé la distribution pour mettre en évidence la tendance sous-jacente. Nous avons trouvé une faible corrélation positive entre la proportion de ménages qui gagnent moins de 45 000 $ par an et le nombre de prédictions qu'un groupe de blocs reçoit et une faible corrélation négative pour le reste des niveaux de revenu. Cela signifie que les données suggèrent qu'à mesure que le nombre de prédictions augmente, la proportion de ménages qui gagnent moins de 45 000 $ par an augmente. La proportion de ménages gagnant moins de 45 000 $ par an est positivement corrélée aux prédictions. prédictions qu'ils ont reçues et calculé la proportion de personnes de chaque tranche de revenu dans notre analyse qui y vivaient. Après avoir calculé la distribution pour chacune de nos 38 juridictions individuellement, nous avons calculé la valeur moyenne pour chaque seau dans tous les groupes d'îlots. Ceci est illustré dans la figure ci-dessous. La figure montre la même tendance que celle que nous avons observée dans notre analyse précédente : en examinant les données des 38 juridictions ensemble, en moyenne, à mesure que le nombre de prédictions reçues par un groupe de blocs augmente, la proportion de ménages qui gagnent moins de 45 000 $ par an augmente. À mesure que les prévisions augmentaient, le revenu moyen des ménages diminuait Notre analyse a révélé que, par rapport à l'ensemble de la juridiction, une proportion plus élevée de ménages à faible revenu d'une juridiction vivaient dans les groupes d'îlots que le logiciel de PredPol ciblait le plus, et une proportion plus élevée de ménages aisés vivaient dans les groupes de blocs qu'il ciblait le moins. Nous avons également constaté que sur l'ensemble de la distribution, à mesure que les prédictions reçues par un groupe de blocs augmentaient, la proportion de ménages gagnant 45 000 $ par an ou moins augmentait également. Pour voir comment la composition a changé pour les juridictions individuelles, consultez notre Github ici. Analyse du logement public Alors que nous continuions à explorer ces zones les plus prévisibles, nous avons remarqué qu'un grand nombre se trouvaient dans et autour de complexes de logements sociaux, abritant certains des résidents les plus pauvres du pays. À l'aide de l'outil de recherche de logement en ligne de HUD, nous avons rassemblé les emplacements de 4 001 communautés de logements subventionnés publics ou privés, de refuges pour sans-abri et de logements pour personnes âgées et ayant des besoins spéciaux dans les juridictions de nos données. Nous avons ensuite examiné la fréquence à laquelle PredPol avait prédit qu'un crime se produirait là-bas. Pour 22 juridictions dans nos données (57%), plus des trois quarts de leurs logements sociaux étaient situés dans des groupes d'îlots que PredPol ciblait plus que la médiane. Pour certaines juridictions, la majorité des logements sociaux étaient situés dans les groupes d'îlots les plus ciblés : à Jacksonville, 63 % des logements sociaux étaient situés dans les groupes d'îlots les plus ciblés par PredPol. À Elgin, 58 % des logements sociaux étaient situés dans les groupes d'îlots les plus ciblés par PredPol. à Portage; Livermore, Californie; Cacao, Floride ; Jordanie du Sud, Utah ; Gloucester, New Jersey; et Piscataway, chaque établissement de logement social était situé dans des groupes d'immeubles les plus ciblés. Dans 10 juridictions, PredPol a prédit des crimes dans des blocs avec des communautés de logements sociaux presque chaque jour où le programme y était utilisé. (Étant donné que cette analyse ne nécessitait pas de données démographiques du recensement, nous avons compté le nombre de prédictions pour leurs emplacements.) Nous avons pu obtenir des données sur les arrestations pour certains de ces départements, mais lorsque nous les avons comparées au taux et au type de prédictions faites, elles pourraient être à des kilomètres l'un de l'autre. Par exemple, PredPol a prédit que les agressions se produiraient en moyenne cinq fois par jour aux Sweet Union Apartments, une communauté de logements sociaux à Jacksonville - 3 276 prédictions sur les 614 jours pendant lesquels le département de police de Jacksonville a utilisé le logiciel au cours de la période analysée. PredPol a déclaré que Jacksonville avait à un moment donné créé trop de quarts de travail, il recevait donc des prédictions répétées. Le service de police n'a pas répondu aux demandes de commentaires. On ne sait pas si la police a augmenté les patrouilles dans ces zones en conséquence (voir plus dans Limitations). Les données sur les arrestations fournies par la police de Jacksonville ont montré que les agents y ont procédé à 31 arrestations au cours de cette période. Seulement quatre concernaient des violences conjugales ou des voies de fait. La majorité des 27 autres infractions étaient des mandats non exécutés ou la possession de drogue. Interpellations, arrestations et recours à la force Nous avons cherché à déterminer l'effet des prédictions PredPol sur les données d'application de la loi couramment collectées : interpellations, arrestations et recours à la force. Pour ce faire, nous avons fait plus de 100 demandes de dossiers publics à 43 agences dans nos données pour leurs données sur le recours à la force, la criminalité, l'interpellation et l'arrestation de 2018 à 2020. Nous nous sommes concentrés sur les juridictions où les prédictions de PredPol ciblaient de manière disproportionnée les Noirs, les Latinos. , ou les quartiers à faible revenu et où le logiciel a prédit les types de crimes non contre la propriété. Nous avons également demandé des données de "dosage", qui est le terme de PredPol pour les données que le logiciel fournit aux agences qui suivent quand les agents visitent chaque boîte de prédiction et combien de temps ils y passent - mais les demandes ont été catégoriquement rejetées par presque toutes les agences, beaucoup au motif que l'agence a cessé d'utiliser PredPol et ne pouvait plus accéder aux informations. Certaines agences ont refusé de nous fournir la moindre donnée ; d'autres nous ont fourni des données. Seuls deux – Plainfield, New Jersey et Portage – nous ont fourni tous les types de données que nous avons demandés. Nous avons obtenu des données sur les arrêts de piétons ou de circulation de huit agences, les données d'arrestation de 11 agences et les incidents de recours à la force par des agents de cinq agences. Certains des dossiers de recours à la force ont été fournis sous forme de rapports écrits plutôt que de données, nous avons donc extrait les métadonnées pour créer des feuilles de calcul. Chaque ensemble de nouvelles données a ensuite été vérifié par rapport aux enregistrements originaux par un autre journaliste du projet. Nous avons géolocalisé chaque incident d'arrestation, d'interpellation ou de recours à la force à une coordonnée de latitude/longitude. Cela nous a permis de vérifier si l'incident s'est produit le même jour qu'une prédiction PredPol et à moins de 250 pieds du centre de la zone de 500 pieds sur 500 pieds suggérée pour la patrouille (appelée "à l'intérieur de la zone" par PredPol). Lorsqu'une agence ne nous a fourni aucune donnée, nous avons recueilli des statistiques sur les arrestations au niveau de la juridiction à partir du programme Uniform Crime Reporting du FBI. Analyse des arrêts, des arrestations et du recours à la force PredPol affirme que l'utilisation de son logiciel entraînera probablement moins d'arrestations, car l'envoi d'agents dans les boîtes de prédiction de l'entreprise crée un effet dissuasif. Cependant, nous n'avons pas observé que PredPol avait un impact mesurable sur les taux d'arrestation, dans les deux sens. (Voir Limitations pour en savoir plus sur cette analyse.) Bien que ces résultats soient limités, un examen plus approfondi des groupes de blocs ciblés le plus souvent par PredPol suggère que le logiciel recommandait à la police de retourner dans les mêmes blocs majoritaires noirs et latinos où ils avaient déjà fait arrestations. Lorsque nous avons comparé les arrestations par habitant dans les groupes de blocs que PredPol ciblait le plus fréquemment - ceux dans les 5 % les plus performants pour les prédictions - avec le reste de la juridiction, nous avons constaté qu'ils avaient des arrestations plus élevées par habitant que les groupes de blocs les moins ciblés et les juridiction dans son ensemble. Ces zones d'arrestations élevées ont également des concentrations plus élevées de résidents noirs et latinos que l'ensemble de la juridiction, selon les données du recensement. Par exemple, les données fournies par Salisbury, en Géorgie, de 2018 à 2020 montrent que les arrestations par habitant dans les groupes de blocs les plus ciblés, ceux qui figurent dans les 5 % les plus performants pour les prévisions, étaient près de sept fois le taux d'arrestation de la juridiction dans son ensemble. La proportion de résidents noirs et latinos vivant dans ces groupes d'îlots les plus ciblés est le double de celle de la juridiction dans son ensemble, selon les chiffres du recensement. Les quartiers avec le plus de prédictions de crimes avaient des taux d'arrestation plus élevés. Ce même schéma s'est répété pour les 11 départements qui nous ont fourni des données désagrégées sur les arrestations : les groupes de blocs les plus ciblés par PredPol avaient à la fois des pourcentages plus élevés de résidents noirs ou latinos et des arrestations par habitant plus élevées que la juridiction dans son ensemble. Nous avons constaté une tendance similaire pour les organismes qui nous ont fourni des données sur les incidents de recours à la force. Pour trois d'entre eux sur cinq, les taux de recours à la force par habitant étaient plus élevés dans les groupes d'îlots les plus ciblés que dans l'ensemble de la juridiction. À Plainfield, les taux de recours à la force par habitant dans les groupes d'îlots les plus ciblés de la juridiction étaient près de deux fois supérieurs à ceux de l'ensemble de la juridiction. À Niles, dans l'Illinois, le recours à la force par habitant dans les groupes d'îlots les plus ciblés était plus de deux fois supérieur au taux de la juridiction. À Piscataway., C'était plus de 10 fois le taux de la juridiction. Les arrestations et les incidents de recours à la force sont influencés par beaucoup trop de variables pour attribuer des changements statistiques ou tout contact particulier directement aux prédictions de PredPol sans autre preuve.