Incidents associés
Des chercheurs en sécurité avertissent que les données exposées sur Internet, même brièvement, peuvent persister dans des chatbots d'IA générative en ligne comme Microsoft Copilot longtemps après leur privatisation.
Des milliers de dépôts GitHub autrefois publics appartenant à certaines des plus grandes entreprises mondiales sont concernés, dont celui de Microsoft, selon de nouvelles conclusions de Lasso, une société israélienne de cybersécurité spécialisée dans les menaces émergentes liées à l'IA générative.
Ophir Dror, cofondateur de Lasso, a déclaré à TechCrunch que l'entreprise avait trouvé du contenu de son propre dépôt GitHub apparaissant dans Copilot parce qu'il avait été indexé et mis en cache par le moteur de recherche Bing de Microsoft. M. Dror a expliqué que le dépôt, rendu public par erreur pendant une brève période, avait depuis été rendu privé et que l'accès à celui-ci sur GitHub renvoyait une erreur « page introuvable ».
« Sur Copilot, étonnamment, nous avons trouvé l'un de nos propres dépôts privés », a déclaré M. Dror. Si je naviguais sur le web, je ne verrais pas ces données. Mais n'importe qui pourrait poser la bonne question à Copilot et obtenir ces données.
Après avoir réalisé que toute donnée sur GitHub, même brièvement, pouvait être potentiellement exposée par des outils comme Copilot, Lasso a approfondi ses recherches.
Lasso a extrait une liste de dépôts publics en 2024 et identifié ceux qui avaient depuis été supprimés ou rendus privés. Grâce au mécanisme de mise en cache de Bing, l'entreprise a découvert que plus de 20 000 dépôts GitHub, devenus privés, contenaient encore des données accessibles via Copilot, affectant plus de 16 000 organisations.
Lasso a déclaré à TechCrunch, avant la publication de son étude, que les organisations concernées comprenaient Amazon Web Services, Google, IBM, PayPal, Tencent et Microsoft. Amazon a déclaré à TechCrunch après la publication qu'elle n'était pas concernée par le problème. Lasso a déclaré avoir « supprimé toute référence à AWS suite aux conseils de son équipe juridique » et que « nous maintenions fermement nos recherches ».
Les poids lourds de la technologie et du capital-risque rejoignent le programme Disrupt 2025
Netflix, ElevenLabs, Wayve, Sequoia Capital, Elad Gil… voici quelques-uns des acteurs majeurs qui rejoignent le programme Disrupt 2025. Ils sont là pour vous apporter les informations qui stimulent la croissance des startups et vous permettent de vous démarquer. Ne manquez pas le 20e anniversaire de TechCrunch Disrupt et l'occasion d'apprendre auprès des plus grands noms de la technologie. Réservez votre billet dès maintenant et économisez jusqu'à 600 $ avant la hausse des prix.
Pour certaines entreprises concernées, Copilot pourrait être amené à restituer des archives GitHub confidentielles contenant de la propriété intellectuelle, des données d'entreprise sensibles, des clés d'accès et des jetons, a indiqué l'entreprise.
Lasso a indiqué avoir utilisé Copilot pour récupérer le contenu d'un dépôt GitHub – depuis supprimé par Microsoft – qui hébergeait un outil permettant la création d'images d'IA « offensantes et nuisibles » à l'aide du service d'IA cloud de Microsoft.
Dror a déclaré que Lasso avait contacté toutes les entreprises « gravement affectées » par l'exposition des données et leur avait conseillé de procéder à la rotation ou à la révocation de toute clé compromise.
Aucune des entreprises concernées citées par Lasso n'a répondu aux questions de TechCrunch. Microsoft n'a pas non plus répondu à la demande de TechCrunch.
Lasso a informé Microsoft de ses conclusions en novembre 2024. Microsoft a indiqué à Lasso avoir classé le problème comme « faible gravité », précisant que ce comportement de mise en cache était « acceptable ». Microsoft n'incluait plus de liens vers le cache de Bing dans ses résultats de recherche à partir de décembre 2024.
Cependant, Lasso indique que, malgré la désactivation de la mise en cache, Copilot avait toujours accès aux données, même si elles n'étaient pas visibles via les recherches web traditionnelles, ce qui indique une solution temporaire.
Mise à jour avec les commentaires post-publication d'Amazon Web Services et de Lasso.