Report 6137

Ce qui n'était au départ qu'une fonctionnalité de partage s'est transformé en une visibilité SEO inattendue. Plus de 100 000 conversations ChatGPT étaient accessibles au public, certaines indexées et beaucoup archivées bien avant la réponse d'OpenAI.

Tout a commencé par une chose simple : un bouton « Partager ».

Lorsqu'OpenAI a permis aux utilisateurs de partager publiquement les conversations ChatGPT, cette fonctionnalité a probablement semblé utile. On clique, on obtient un lien clair et on met en avant une invite intéressante ou un échange amusant.

À quoi ressemble le bouton de partage sur ChatGPT

Mais derrière ce bouton se trouvait une petite case à cocher : « Rendre cette conversation visible ». Et cela a tout changé.

à quoi cela ressemble lorsque les conversations ChatGPT sont partagées

Les gens ont cliqué sans réfléchir. Et comme par magie, des milliers de conversations ChatGPT ont atterri dans les résultats de recherche Google. Il ne s'agissait plus de liens privés, mais de pages publiques, visibles par tous. Certaines étaient inoffensives. Beaucoup ne l'étaient pas.

Certaines conversations révélaient des CV et des candidatures. D'autres incluaient des plans d'affaires internes, des opinions politiques sensibles, des aveux de tricherie universitaire ou des difficultés profondément personnelles. De vrais noms y étaient associés. De vraies personnes étaient exposées. Et pendant un instant, tout était consultable sur Google.

Tahir Naqash a tweeté que même les clés API et les invites de développeurs apparaissaient dans les résultats de recherche.

Pete Sena a illustré le problème en temps réel, en partageant des recherches Google qui ont fait apparaître des conversations ChatGPT très personnelles directement depuis le domaine d'OpenAI.

Fast Company a détecté le problème très tôt. Les spécialistes du référencement et les détectives numériques ont trouvé encore plus de résultats. OpenAI a réagi rapidement. Ils ont ajouté des balises noindex et nofollow aux pages de chat partagées et ont demandé à Google de les supprimer. Et, à juste titre, Google a réagi. Des dizaines de milliers de liens ont disparu des résultats de recherche.

Le responsable de la sécurité informatique d'OpenAI a confirmé sur X que la fonctionnalité avait été supprimée.

Mais le mal était déjà fait.

Car Google n'est pas le seul endroit où l'information est stockée. Lorsqu'OpenAI a corrigé le problème d'indexation, une grande partie de ces conversations partagées avait déjà été sauvegardée par Internet Archive.

Plus de 100 000 d'entre elles, selon les chercheurs Henk van Ess et Nicolas Deleur. Archivées intégralement. Consultables. Permanentes.

Et le plus grave : Archive.org affirme qu'OpenAI n'a demandé la suppression d'aucune d'entre elles.

Mark Graham, directeur des Archives Internet, a répondu à la question de van Ess : si OpenAI demandait la suppression des URL chatgpt.com/share, il est probable qu'elle l'honorerait. Mais jusqu'à présent, OpenAI n'a pas formulé cette demande.

Cela soulève de nombreuses questions :

À qui appartient réellement une conversation ChatGPT une fois partagée ?
OpenAI devrait-il protéger les utilisateurs qui n'ont pas pleinement conscience de ce qu'ils partagent ?
Et si certains utilisateurs veulent que leurs conversations soient préservées ? Quels droits comptent le plus ?

Et peut-être la question la plus importante :

Faut-il vraiment déployer des fonctionnalités de partage public sans que les utilisateurs comprennent ce qu'ils exposent ?

Même aujourd'hui, le fichier robots.txt d'OpenAI permet techniquement toujours aux moteurs de recherche d'accéder à /share/*. Cela ne mène plus à l'indexation grâce aux nouvelles balises méta, mais cela rappelle combien il est facile de négliger des détails qui peuvent révéler des personnes réelles.

Ceci n'est pas un article à succès sur OpenAI. La vérité est plus complexe. Nous sommes tous en train de rattraper la vitesse de ces outils. ChatGPT fait facilement oublier qu'une conversation apparemment privée peut, d'un simple clic, devenir une page publiée.

C'est ce qui s'est passé ici. Les gens ne pensaient pas que « Partager » signifiait « rendre cette page consultable pour toujours ». Mais c'est le cas. Et Internet ne pardonne pas.

Google a peut-être effacé les traces, mais beaucoup de ces discussions complètes sont toujours sur Archive.org. Elles n'ont pas disparu. Elles sont juste ailleurs.

Et la solution ? C'est simple. Il suffit à OpenAI de demander.

Mais pour l'instant, ces conversations sont toujours là. En attente.

Les coulisses

Cet article a débuté par une simple curiosité SEO. Nous cherchions à comprendre le classement des pages partagées de ChatGPT sur Google. La suite est allée plus loin : une plongée dans la permanence des données, la conception éthique et la façon dont les plateformes façonnent ce que nous exposons en ligne. Ce qui a commencé avec le classement des résultats de recherche a fini par soulever des questions sur la responsabilité, la confidentialité et l'architecture même d'Internet.

Les données Ahrefs enregistrent une augmentation du trafic organique vers les pages partagées de ChatGPT juste avant l'intervention d'OpenAI. Le graphique montre une forte hausse suivie d'une chute brutale.

Trafic organique sur Google basé sur les AHrefs de ces chats

Ce que les équipes SEO et produit devraient en tirer

Il ne s'agissait pas simplement d'un problème de confidentialité. Cela montre comment le produit, l'expérience utilisateur et le SEO peuvent se combiner de manière à exposer discrètement les utilisateurs. Voici ce qu'il faut retenir :

Ce n'était pas un bug : La case « Détectable par les moteurs de recherche » était intentionnelle. Mais elle a été traitée comme un petit paramètre alors qu'elle aurait dû être une décision délicate.
La plupart des utilisateurs ne sont pas des SEO : Ils ne pensaient pas à l'indexation, au scraping ou à la visibilité dans les résultats de recherche. Le produit ne les a pas aidés à prendre le temps d'évaluer le risque. - Il fallait une certaine friction : Cette case à cocher aurait dû être masquée dans les paramètres avancés, avec une deuxième confirmation ou une formulation plus claire sur la signification réelle de « découvrable ».
Pas de visibilité, pas de contrôle : Les utilisateurs ne recevaient aucune alerte, aucune statistique de trafic, ni aucun avis indiquant que leur discussion était désormais publique et indexée. Il n'y avait aucun moyen de révoquer, d'expirer, ni même de surveiller l'exposition.

Problème 6137

Incidents associés

Incident 11865 Rapports
Reported Public Exposure of Over 100,000 LLM Conversations via Share Links Indexed by Search Engines and Archived

Les chats ChatGPT ont été indexés puis supprimés de la recherche, mais restent toujours en ligne

Tout a commencé par une chose simple : un bouton « Partager ».

Cela soulève de nombreuses questions :

Ce que les équipes SEO et produit devraient en tirer

Problème 6137

Incidents associés

Incident 11865 RapportsReported Public Exposure of Over 100,000 LLM Conversations via Share Links Indexed by Search Engines and Archived

Les chats ChatGPT ont été indexés puis supprimés de la recherche, mais restent toujours en ligne

Tout a commencé par une chose simple : un bouton « Partager ».

Cela soulève de nombreuses questions :

Ce que les équipes SEO et produit devraient en tirer

Incident 11865 Rapports
Reported Public Exposure of Over 100,000 LLM Conversations via Share Links Indexed by Search Engines and Archived