Introduction Début 2018, plusieurs groupes de défense ont remarqué une baisse des taux d'ouverture pour les abonnés possédant des domaines Gmail. Ils ont dit que cela avait un impact négatif sur les appels à l'action et les dons. En utilisant les données qui nous ont été envoyées par trois de ces groupes de défense ainsi que par Change.org, une société à but lucratif qui héberge des pétitions pour des causes politiques, nous avons confirmé qu'il y avait une diminution durable des taux d'ouverture propres aux abonnés utilisant Gmail. Tout au long de 2017, toutes les organisations du tableau ci-dessus avaient des taux d'ouverture des e-mails nettement plus élevés pour les abonnés Gmail que ceux qui utilisaient d'autres fournisseurs. Les taux d'ouverture de Gmail pour Change.org (représentés par la ligne de tendance rouge ci-dessus) étaient, en moyenne, 66 % plus élevés que ceux des non-abonnés à Gmail. Entre janvier et mai 2018 (le rectangle bleu dans le graphique), les taux d'ouverture pour les abonnés Gmail dans les quatre organisations ont chuté d'au moins 47 % par rapport aux taux d'ouverture pour les non-abonnés Gmail. Change.org a connu la plus forte baisse, 79 %. Après mai 2018, le rapport entre les taux d'ouverture Gmail et non-Gmail était généralement inférieur à 1,0 pour les organisations de défense. (Nous n'avons pas de données pour CREDO Action après mai 2018.) Cela signifie des taux d'ouverture plus élevés pour les abonnés non Gmail que pour les abonnés Gmail. Nous avons convenu de ne pas partager publiquement les taux d'ouverture bruts, mais nous les avons examinés et il n'y a pas eu d'augmentation statistiquement significative des taux d'ouverture pour les utilisateurs non-Gmail entre janvier et mai 2018 pour aucun des quatre groupes que nous avons analysés. Lors des entretiens, les groupes de défense auxquels nous avons parlé soupçonnaient que la chute des taux d'ouverture était due à un changement dans la salle de courrier automatisée de Gmail qui plaçait leurs e-mails dans la boîte de réception "promotions" plutôt que dans la boîte de réception principale des utilisateurs. La boîte de réception des promotions est l'un des cinq onglets ajoutés à Gmail étiquetés de manière algorithmique en 2013 Pour commencer à comprendre comment Gmail classe et trie les e-mails politiques, nous avons conçu une expérience avec une nouvelle adresse e-mail. Nous nous sommes abonnés pour recevoir des e-mails de plus de 200 groupes politiques : des candidats à la présidence, des représentants de la Chambre approchant d'une réélection dans les États du champ de bataille**, des groupes de réflexion** et des organisations de défense qui ont organisé ou soutenu des questions politiques. Tout le monde ne nous a pas envoyé d'e-mails. Après quatre mois de collecte de données, nous avons analysé 5 134 e-mails de 171 groupes et politiciens. ## Principaux points à retenir Dans l'ensemble du spectre politique, Gmail a détourné près de 90 % des e-mails politiques de la boîte de réception principale de notre expérience. La plupart sont allés dans le dossier "promotions" (50 %), une fonctionnalité activée par défaut, ou dans le dossier spam (40 %). Environ 11% de tous les e-mails ont été livrés dans la boîte de réception principale. Gmail a bloqué presque la moitié des expéditeurs politiques de notre échantillon à partir de la boîte de réception principale : 42 % des expéditeurs n'ont pas réussi à envoyer un seul e-mail dans la boîte de réception principale. (Cette statistique exclut les expéditeurs avec moins de deux e-mails dans notre échantillon.) Gmail a classé les e-mails des candidats à la présidentielle comme des promotions 64 % du temps, ce qui est plus que pour les autres catégories d'e-mails politiques. Il a envoyé plus de 90% des e-mails de Bernie Sanders et Amy Klobuchar à des promotions. Gmail a dirigé moins de 1 % des e-mails de campagne des titulaires de la Chambre des représentants dans les États du champ de bataille vers la boîte de réception principale. Il y avait quelques valeurs aberrantes : l'algorithme de Gmail a envoyé la majorité des e-mails de certains expéditeurs, dont l'American Enterprise Institute (99 %), les Socialistes démocrates d'Amérique (75 %) et Pete Buttigieg (63 %), dans la boîte de réception principale. ## Limites Nos conclusions sont basées sur une étude de quatre mois d'une adresse e-mail modèle et d'une liste de candidats politiques, de groupes de défense et de groupes de réflexion qui était solide mais en aucun cas exhaustive. Nos données montrent comment Gmail a géré une boîte de réception particulière sans intervention de l'utilisateur ; c'est ainsi que l'algorithme par défaut a fonctionné dans ce cas sans la participation individuelle de l'utilisateur. Gmail indique que ses algorithmes répondent aux interactions de chaque utilisateur pour ajuster la catégorisation dans l'ensemble et pour les utilisateurs individuels. Si tel est le cas, la catégorisation des e-mails variera d'une personne à l'autre. On ne sait pas dans quelle mesure ce comportement affecterait la catégorisation du courrier politique pour une personne donnée, mais il est important de noter que nos résultats ne correspondent pas nécessairement à la destination des e-mails pour un utilisateur Gmail particulier. Nous n'avons pas déterminé pourquoi Gmail a classé certains e-mails ou les e-mails de certains expéditeurs comme il l'a fait. Gmail n'a pas d'étiquette explicite dans les métadonnées des e-mails pour la boîte de réception principale. Pour estimer les e-mails qui se sont retrouvés dans la boîte de réception principale, nous avons soustrait les e-mails qui sont allés vers d'autres onglets par défaut (promotions et réseaux sociaux) et les spams. Gmail étiquette également les e-mails avec un tri pour d'autres onglets qu'il propose, tels que "mises à jour", mais nous n'avons pas analysé ces catégories car ces onglets sont désactivés par défaut. La séparation de ces e-mails aurait encore réduit le nombre d'e-mails dans la boîte de réception principale, de 540 e-mails pour le seul onglet "mises à jour". Les organisations et les campagnes envoient des e-mails à partir d'adresses et de domaines différents. Nous avons donc utilisé un alias de suivi distinct pour chaque groupe et campagne (par exemple, email+dnc@gmail.com) pour identifier le expéditeur. Tous les e-mails envoyés à cette adresse ont été attribués à cet expéditeur. Par conséquent, certains e-mails peuvent avoir été attribués à un expéditeur de manière incorrecte en raison du partage ou de la vente de listes d'abonnés aux e-mails. Pour discerner la fréquence à laquelle cela pourrait se produire, nous avons vérifié un échantillon de 400 e-mails (100 de chaque catégorie d'expéditeur) et avons découvert que seuls quatre d'entre eux, soit un pour cent, provenaient d'un autre expéditeur. Parmi ceux-ci, deux e-mails que nous avons attribués à End the Border Crisis Now ont plutôt été envoyés par Chip Roy, qui finance ce site Web. Les deux autres e-mails provenant d'un expéditeur autre que l'alias provenaient de la campagne TJ Cox. Ils ont été envoyés à l'adresse e-mail que nous avions configurée pour la campagne de Harley Rouda. Il semble que Rouda ait partagé sa liste d'abonnés avec d'autres. Lorsque nous avons vérifié tous les e-mails des candidats à la présidence, le seul e-mail mal étiqueté était celui du GOP qui utilisait un alias que nous avions créé pour les événements Trump. Sur les 231 campagnes et groupes auxquels nous nous sommes abonnés, 60 ne nous ont envoyé aucun email, dont notamment DonaldJTrump.com. # Collecte de données Nous avons créé un compte Gmail en utilisant un nouveau numéro de mobile le 15 octobre 2019. Nous avons utilisé un nouveau numéro de téléphone pour éviter que Google l'associe à un profil d'utilisateur Google existant. Google nous a révélé que l'activité des utilisateurs influence la classification des e-mails. Nous avons utilisé notre nouvelle adresse e-mail pour nous abonner aux communications par e-mail de 231 entités : candidats à la présidence (N=17), représentants de la Chambre dans les États du champ de bataille (N=141), et organisations de défense et groupes de réflexion (N=73). La liste des groupes de défense politique et des groupes de réflexion n'est ni exhaustive ni scientifique, mais nous avons recherché la représentation d'organisations de tous les horizons politiques. Nous nous sommes assurés d'inclure les groupes qui avaient initialement signalé la baisse des taux d'ouverture en 2018 (CREDO Action, Democracy for America, SumOfUs, Color Of Change, Demand Progress, Courage Campaign, Presente.org, Social Security Works) ainsi que Change. org, qui a remarqué la baisse indépendamment. Certains groupes nécessitaient un code postal pour les inscriptions par e-mail. Dans ces cas, nous avons utilisé 33601—Tampa, Fla. Nous avons créé un alias de messagerie personnalisé pour chaque inscription, tel que email+dnc@gmail.com, pour la comptabilité. C'était essentiel pour retracer les e-mails que nous avons reçus jusqu'aux entités initiales avec lesquelles nous les avons partagés. La liste complète des expéditeurs d'e-mails auxquels nous nous sommes abonnés se trouve en annexe. Nous n'avons pas reçu d'e-mails de tous les groupes. Nous avons collecté 5 417 e-mails dans notre boîte de réception du 16 octobre 2019 au 12 février 2020, provenant de 171 des 231 entités auxquelles nous nous sommes inscrits. Pendant cette période, nous avons périodiquement exporté la boîte de réception vers un fichier mbox dans Google takeout. Mbox est un format standardisé de stockage d'une boîte de réception de courrier électronique sous la forme d'un seul fichier texte semi-structuré. Des exportations régulières étaient essentielles, car les e-mails marqués par Gmail comme spam disparaissaient au bout de 30 jours. Nous n'avons pas ouvert, déplacé ou étiqueté les e-mails dans la boîte de réception. # Prétraitement des données Nous avons prétraité les fichiers mbox en extrayant les champs de métadonnées pertinents, en filtrant 44 e-mails envoyés par Google et 235 e-mails provenant d'adresses e-mail ne figurant pas dans notre échantillon d'étude. Ces 235 e-mails proviennent de groupes apolitiques (comme les éclaireuses et les anciens combattants) auxquels nous avions souscrit au début de l'expérience, mais que nous avons depuis retirés de notre étude. Ils incluent également les e-mails qui n'ont pas été envoyés à un alias de suivi, ce qui peut s'être produit parce que le formulaire d'inscription par e-mail a rejeté l'alias ou que l'expéditeur a supprimé l'alias. Il n'y avait pas d'e-mails dans la corbeille ou de dossiers envoyés, que nous aurions supprimés de l'étude. Notre ensemble de données final se composait de 5 134 e-mails. # Comment nous avons classé les e-mails Nous avons référencé les propres étiquettes d'e-mail de Gmail, trouvées dans le champ de métadonnées X-Gmail-Labels, pour établir un ensemble de classifications pour les e-mails que nous avons reçus. ## Catégorie d'e-mail La boîte de réception principale correspond aux e-mails qui ne contiennent pas de "promotions de catégorie", de "spam" ou de "corbeille" dans X-Gmail-Labels. Les promotions sont celles étiquetées par Gmail comme promotions de catégorie dans X-Gmail-Labels mais pas comme spam. Bien que les e-mails puissent recevoir les deux étiquettes par Gmail, la présence de l'étiquette de spam dirige l'e-mail vers le dossier spam de l'interface utilisateur. Dans notre échantillon, 69,22 % des e-mails qualifiés de spam par Gmail étaient également qualifiés de promotions de catégorie. Nous avons marqué ces e-mails comme spam et non comme promotions. Spam désigne tout e-mail marqué par Gmail comme spam dans X-Gmail-Labels. Nous n'avons analysé les données que pour le placement des e-mails dans les spams et les onglets activés par défaut par Gmail : principal, promotions et réseaux sociaux. Gmail propose deux autres onglets, mais ceux-ci doivent être activés par l'utilisateur. ## Construire notre liste de diffusion Nous avons utilisé les distinctions suivantes lors du choix des entités auxquelles nous inscrire : l'appendice. # Analyse Dans l'ensemble, Gmail a détourné presque tous les e-mails des groupes politiques et des candidats que nous nous sommes inscrits pour recevoir (89,37 %) vers des promotions ou des spams. Il n'a livré que 10,64% dans la boîte de réception principale. Pour de nombreux expéditeurs, Gmail n'a pas envoyé un seul e-mail à la boîte de réception principale. Parmi les entités avec au moins deux e-mails dans notre échantillon, Gmail en a bloqué près de la moitié de la boîte de réception principale : 41,61 % n'ont reçu aucun e-mail dans la boîte de réception principale lors de notre test. La classification des e-mails de Gmail variait d'un expéditeur à l'autre et d'une catégorie à l'autre. ## Catégorisation de Gmail par catégorie d'expéditeur Ce tableau montre les variations dans la façon dont Gmail a traité les e-mails de différentes catégories d'entités politiques dans notre expérience. Nous avons collecté des données du 16 octobre 2019 au 12 février 2020. Pour les campagnes internes, Gmail a envoyé moins de 1 % des e-mails à la boîte de réception principale, détournant la moitié des e-mails vers des promotions. Gmail a traité les e-mails officiels de House différemment, permettant à près de la moitié de ces e-mails d'être envoyés dans la boîte de réception principale, bien plus que les autres types d'expéditeurs. Pourtant, Gmail a détourné un quart des e-mails officiels de la Chambre vers des promotions, même si les adresses «.gov» ne peuvent pas légalement être utilisées pour faire campagne. Les candidats à la présidence avaient le deuxième plus faible nombre d'e-mails envoyés à la boîte de réception principale, 6,40 %. Gmail a envoyé moins d'e-mails de candidats à la présidence au spam qu'il ne l'a fait pour d'autres groupes, mais a envoyé la plus grande part aux promotions, 63,81 %. En zoomant sur chaque candidat à la présidentielle, deux étaient des valeurs aberrantes, Gmail envoyant un taux élevé de leur courrier dans la boîte de réception principale : Pete Buttigieg et Andrew Yang, avec 62,79 % et 46,38 %, respectivement, bien plus que tout autre candidat. Gmail a détourné moins de 9 % de ses e-mails vers des promotions. Comparez cela à Elizabeth Warren, Joe Biden, Kamala Harris, Joe Walsh et Beto O'Rourke : Gmail n'a dirigé aucun de leurs e-mails vers la boîte de réception principale de notre expérience. Gmail a classé environ 85 % des e-mails de Warren et Biden comme des promotions. Pour Sanders et Klobuchar, Gmail a envoyé plus de 90 % de leurs e-mails à l'onglet des promotions, le plus parmi les candidats à la présidentielle. Il n'a livré que 1,8 % et 0,96 % de leurs e-mails, respectivement, dans la boîte de réception principale. ## E-mails des candidats à la présidentielle Ce tableau montre comment Gmail a classé les e-mails de chaque candidat à la présidentielle dans notre test. Nous avons collecté des données du 16 octobre 2019 au 12 février 2020, à l'exception de Gabbard, dont nous avons commencé à collecter les e-mails le 8 novembre 2019 ; et Bloomberg et Steyer, dont les e-mails ont été recueillis du 6 février 2020 au 12 février 2020. Bien que nous nous soyons abonnés aux mises à jour par e-mail sur DonaldJTrump.com, nous n'avons reçu aucun e-mail de la campagne Trump. Nous nous sommes également inscrits à un événement Trump et avons reçu un e-mail envoyé par contact@action.gop.com, qui a atterri dans le spam. Pour les quatre groupes qui ont déclaré avoir été lésés par la baisse de leurs taux d'ouverture de Gmail à partir de 2018, Gmail a envoyé entre 60,23 % et 90,24 % de leurs e-mails aux promotions de notre expérience. C'était plus élevé que la moyenne de tous les groupes de défense et groupes de réflexion auxquels nous nous sommes inscrits, qui était de 46,38 %. ## Sélectionnez des organisations de défense Ce tableau montre comment Gmail a classé les e-mails de certains groupes de défense dans notre expérience. Ces groupes ont signalé une baisse soudaine des taux d'ouverture il y a deux ans. Les données ont été collectées du 16 octobre 2019 au 12 février 2020. Pour deux des groupes, Gmail n'a envoyé aucun e-mail à la boîte de réception principale de notre expérience. L'un de ces groupes, CREDO Action, shut down en janvier 2020. Juste comme les e-mails de certains candidats à la présidentielle étaient des valeurs aberrantes dans la fréquence à laquelle Gmail les envoyait dans la boîte de réception principale, il en était de même pour certains groupes de défense et groupes de réflexion, comme l'American Enterprise Institute, le Claremont Institute et les Democratic Socialists of America, à 98,86, 82,35 et 75 %, respectivement (voir annexe). # Réponse de l'entreprise La responsable des communications de Google, Katie Wattie, a déclaré dans un e-mail que les catégories de l'entreprise "aident les utilisateurs à organiser leur courrier électronique". "Les classifications de messagerie s'ajustent automatiquement pour correspondre aux préférences et aux actions des utilisateurs", a-t-elle déclaré. "Les utilisateurs aiment vraiment l'organisation des onglets." Wattie a refusé de dire si la plupart des utilisateurs gardent l'onglet, mais une entreprise de délivrabilité des e-mails a déclaré qu'environ 34 % des répondants à une [enquête de 2016] (https://www.validity.com/resource-center/report/guide-to-gmail -categories/) ont déclaré les utiliser. En réponse aux craintes que les onglets et les annonces de la boîte de réception de Gmail ne se transforment en un "fil d'actualités de style Facebook où vous devez payer pour le placement", Wattie a répondu : "Ce que vous décrivez ne figure pas sur notre feuille de route pour Gmail." Les groupes de défense dont les taux d'ouverture pour les abonnés utilisant Gmail ont chuté en 2018 ont déclaré que, lors d'un appel téléphonique cette année-là, un représentant de Google leur avait suggéré d'acheter des publicités dans l'onglet des promotions pour améliorer leur accès aux utilisateurs de Gmail. Wattie n'a pas répondu directement aux questions sur l'appel, mais a plutôt écrit dans un e-mail que Gmail n'autorisait pas le "contenu politique" dans les publicités depuis 2016 et que celles-ci incluraient la sensibilisation aux problèmes et la collecte de fonds. # Conclusion Nous avons constaté que l'algorithme de Gmail envoyait peu d'e-mails d'hommes politiques et de groupes politiques à la boîte de réception principale de notre expérience. La moitié des e-mails politiques se sont retrouvés dans l'onglet des promotions de Gmail, qui, selon la société, est destiné aux ventes et au marketing. Nous avons également constaté que la catégorisation des e-mails par Gmail était inégale selon les organisations et les politiciens. Par exemple, Gmail n'a pas envoyé un seul des 66 e-mails de Warren à la boîte de réception principale de notre expérience, mais il a envoyé 63 % des e-mails de Buttigieg à la boîte de réception principale, l'emplacement le plus visible dans la boîte de réception à onglets par défaut de Gmail. Ce qui est arrivé à Warren n'est pas inhabituel : pour 42 % des expéditeurs d'e-mails avec au moins deux e-mails dans notre échantillon, Gmail n'a envoyé aucun de leurs e-mails dans la boîte de réception principale. À partir des données que nous avons recueillies, nous n'avons pas été en mesure de déterminer pourquoi Gmail traitait différemment les e-mails de différentes entités politiques. La société a déclaré que son algorithme décide où placer les e-mails en fonction du comportement individuel et du groupe. # Annexe La feuille de calcul des entités politiques auxquelles nous nous sommes inscrits, leur site Web, notre alias de messagerie, ainsi que la catégorie que nous leur avons attribuée peuvent être trouvées [ici](https://github.com/the-markup/investigation-wheres -my-email/blob/master/data/input/newsletter_categories.csv). Une liste des entités politiques qui ne nous ont pas envoyé d'e-mails peut être trouvée [ici](https://github.com/the-markup/investigation -wheres-my-email/blob/master/data/output/appendix/Amisc_email_senders_who_didnt_send.csv).