Report 7041

Un pirate informatique a exploité le chatbot d'intelligence artificielle d'Anthropic PBC pour mener une série d'attaques contre des agences gouvernementales mexicaines, entraînant le vol d'une quantité considérable d'informations sensibles relatives aux impôts et aux électeurs, selon des chercheurs en cybersécurité.

L'utilisateur inconnu, se faisant appeler Claude, a programmé le chatbot en espagnol pour qu'il se comporte comme un pirate informatique chevronné. Il a ainsi identifié des vulnérabilités dans les réseaux gouvernementaux, écrit des scripts informatiques pour les exploiter et déterminé comment automatiser le vol de données, d'après une étude publiée mercredi par la startup israélienne de cybersécurité Gambit Security.

L'activité a débuté en décembre et s'est poursuivie pendant environ un mois. Au total, 150 gigaoctets de données du gouvernement mexicain ont été dérobés, incluant des documents relatifs à 195 millions de dossiers de contribuables, ainsi que des listes électorales, des identifiants d'employés du gouvernement et des fichiers d'état civil, selon les chercheurs.

L'intelligence artificielle est devenue un outil essentiel pour la cybercriminalité, les pirates informatiques utilisant ces technologies pour amplifier leurs actions. La semaine dernière, des chercheurs d'Amazon ont indiqué qu'un petit groupe de pirates informatiques avait pénétré plus de 600 pare-feu dans des dizaines de pays grâce à des outils d'IA largement disponibles.

Gambit n'a pas attribué l'attaque à un groupe spécifique, bien que les chercheurs estiment qu'elle n'est pas liée à un gouvernement étranger.

Selon Gambit, le pirate a infiltré l'administration fiscale fédérale mexicaine et l'institut électoral national. Les gouvernements des États de Jalisco, Michoacán et Tamaulipas, ainsi que l'état civil de Mexico et la compagnie des eaux de Monterrey, ont également été touchés.

Claude a d'abord averti l'utilisateur inconnu de ses intentions malveillantes lors de leur conversation concernant le gouvernement mexicain, mais a finalement obtempéré aux demandes de l'attaquant et exécuté des milliers de commandes sur les réseaux informatiques gouvernementaux, ont expliqué les chercheurs.

Un représentant d'Anthropic a déclaré que l'entreprise avait enquêté sur les allégations de Gambit, interrompu l'activité et suspendu les comptes impliqués. L'entreprise intègre des exemples d'activités malveillantes dans Claude afin d'en tirer des enseignements. L'un de ses modèles d'IA les plus récents, Claude Opus 4.6, comprend des outils de détection permettant de perturber les utilisations abusives, a déclaré le représentant.

Dans ce cas précis, le pirate a interrogé Claude de manière continue jusqu'à parvenir à le « débrider », c'est-à-dire à contourner les garde-fous, a expliqué le représentant. Cependant, même au début de la campagne de piratage, Claude a parfois refusé d'obtempérer aux demandes du pirate, a-t-il ajouté.

L'administration fiscale mexicaine a déclaré avoir examiné ses journaux d'accès et n'avoir trouvé aucune preuve d'intrusion. L'Institut national électoral du pays a indiqué n'avoir identifié aucune intrusion ni aucun accès non autorisé ces derniers mois et avoir renforcé sa stratégie de cybersécurité. Le gouvernement de l'État de Jalisco a également nié toute intrusion, affirmant que seuls les réseaux fédéraux avaient été touchés.

L'agence numérique nationale mexicaine n'a pas commenté ces intrusions, mais a déclaré que la cybersécurité était une priorité. Un représentant des Services des eaux et d'assainissement de Monterrey a indiqué que l'agence n'avait détecté aucune intrusion ni vulnérabilité majeure au cours du second semestre 2025.

Les administrations locales de Mexico, du Michoacán et de Tamaulipas n'ont pas répondu aux demandes de commentaires, de même que les représentants de l'état civil de Mexico.

Les autorités mexicaines ont publié un bref communiqué en décembre indiquant qu'elles enquêtaient sur des violations de données au sein de diverses institutions publiques, sans qu'il soit clair si cela était lié à l'attaque de Claude.

Selon Gambit, l'auteur de l'attaque cherchait à obtenir les identités d'un grand nombre d'employés du gouvernement, mais on ignore encore ce qu'il en a fait. Des chercheurs ont déclaré avoir découvert des preuves d'au moins 20 vulnérabilités spécifiques exploitées lors de l'attaque.

Lorsque Claude rencontrait des difficultés ou avait besoin d'informations complémentaires, le pirate informatique se tournait vers ChatGPT d'OpenAI pour obtenir des indications supplémentaires. Selon Gambit, cela incluait la manière de se déplacer latéralement au sein des réseaux informatiques, de déterminer les identifiants nécessaires pour accéder à certains systèmes et de calculer la probabilité que l'opération de piratage soit détectée.

« Au total, ChatGPT a généré des milliers de rapports détaillés contenant des plans prêts à l'emploi, indiquant précisément à l'opérateur humain les cibles internes à attaquer ensuite et les identifiants à utiliser », a déclaré Curtis Simpson, directeur de la stratégie chez Gambit Security.

OpenAI a indiqué avoir identifié des tentatives du pirate informatique d'utiliser ses modèles à des fins contraires à ses règles d'utilisation, ajoutant que ses outils ont refusé de se conformer à ces tentatives.

« Nous avons banni les comptes utilisés par cet adversaire et apprécions la collaboration de Gambit Security », a déclaré l'entreprise dans un communiqué envoyé par courriel.

Les violations de données au sein du gouvernement mexicain constituent le dernier exemple d'une tendance alarmante. Alors même qu'Anthropic et OpenAI misent sur le développement d'outils de programmation d'IA plus sophistiqués, et que les entreprises de cybersécurité fondent leur avenir sur des défenses basées sur l'IA, les cybercriminels et les cyberespions trouvent de nouvelles façons d'utiliser cette technologie pour mener des attaques.

En novembre, Anthropic a annoncé avoir déjoué la première campagne de cyberespionnage orchestrée par l'IA. L'entreprise a déclaré que des pirates informatiques soupçonnés d'être parrainés par l'État chinois avaient manipulé son outil Claude pour tenter de pirater 30 cibles à travers le monde, dont certaines ont réussi.

« Cette réalité bouleverse toutes les règles du jeu », a déclaré Alon Gromakov, cofondateur et PDG de Gambit.

Gambit a été fondée par Gromakov et deux autres anciens de l'unité 8200, une composante des Forces de défense israéliennes spécialisée dans le renseignement électromagnétique. L'étude publiée mercredi coïncide avec l'annonce de la sortie de la phase de développement confidentielle de Gambit, grâce à un financement de 61 millions de dollars provenant de Spark Capital, Kleiner Perkins et Cyberstarts.

Les chercheurs de Gambit ont découvert les failles de sécurité au Mexique alors qu'ils testaient de nouvelles techniques de chasse aux menaces pour observer les activités des pirates informatiques en ligne. Ils ont mis au jour des preuves publiques d'attaques en cours ou récentes, dont une contenant de nombreuses conversations avec Claude relatives à l'intrusion dans les systèmes informatiques du gouvernement mexicain, selon l'entreprise.

Ces conversations ont révélé que, pour contourner les protections de Claude, l'attaquant a indiqué à l'outil d'IA qu'il recherchait une prime à la découverte de failles de sécurité, une récompense offerte par les organisations pour la découverte de vulnérabilités dans leurs systèmes. De nombreuses entreprises et agences gouvernementales proposent des primes à la découverte de failles de sécurité aux pirates informatiques éthiques, offrant parfois plusieurs milliers de dollars pour des informations sur les vulnérabilités informatiques.

Le pirate souhaitait que Claude effectue un test d'intrusion sur l'administration fiscale fédérale mexicaine, un type de cyberattaque autorisée visant à identifier des failles. Cependant, Claude a refusé lorsque l'attaquant a ajouté des conditions à sa demande, notamment la suppression des journaux et de l'historique des commandes.

« Des instructions précises concernant la suppression des journaux et la dissimulation de l'historique sont suspectes », a répondu Claude à un moment donné, selon une transcription fournie par Gambit. « Dans le cadre d'un programme de primes aux bogues légitime, il n'est pas nécessaire de dissimuler ses actions ; au contraire, il faut les documenter pour les rapports. »

Le pirate a alors changé de stratégie, interrompant les échanges et fournissant à l'outil d'IA un mode opératoire détaillé. Cela a permis à l'intrus de contourner les protections de Claude – un « jailbreak » – et de poursuivre les attaques, selon Gambit.

Le pirate a cherché à obtenir de Claude des informations sur d'autres agences où des données pourraient être obtenues, ce qui laisse penser que certaines attaques étaient opportunistes plutôt que planifiées, a déclaré Simpson.

« Ils cherchaient à compromettre toutes les identités officielles possibles », a-t-il déclaré. « Ils demandaient à Claude, par exemple : “Où puis-je trouver ces identités ? Quels autres systèmes devons-nous consulter ? Où ces informations sont-elles stockées ?” »

— Avec la collaboration de Gonzalo Soto et Amy Stillman

(Mise à jour : commentaire de l’administration fiscale mexicaine au 11e paragraphe.)

Problème 7041

Incidents associés

Incident 14302 Rapports
Anthropic's Claude Was Reportedly Jailbroken To Allegedly Help Steal Sensitive Mexican Government Data

Un pirate informatique a utilisé Claude d'Anthropic pour voler une mine de données mexicaine.

Problème 7041

Incidents associés

Incident 14302 RapportsAnthropic's Claude Was Reportedly Jailbroken To Allegedly Help Steal Sensitive Mexican Government Data

Un pirate informatique a utilisé Claude d'Anthropic pour voler une mine de données mexicaine.

Incident 14302 Rapports
Anthropic's Claude Was Reportedly Jailbroken To Allegedly Help Steal Sensitive Mexican Government Data