Report 2746

Moins de 24 heures après la publication de mon précédent article Data Science Central (ici), des dizaines de copies illégitimes ont commencé à apparaître sur divers sites Web. Ci-dessous un exemple (titre + premier paragraphe) :

Faux : Un guide expérimental de la conjecture de Riemann – le terme correct est preuve heuristique. C'est un argument fort basé sur des preuves empiriques plutôt qu'une preuve formelle d'un point de vue mathématique. Il est assez remarquable que vous ayez décidé de rendre public. Cet article va droit au but sans entrer dans trop de détails sur les concepts. Le but est de donner un bref aperçu afin que le lecteur pressé puisse se faire une assez bonne idée de la méthode. Ce sera aussi En effet, j'ai longtemps hésité entre choisir le titre actuel ou "Introduction to his MPmath Python Library for Scientific Programming".

Réel : Une preuve empirique de la conjecture de Riemann — Le terme correct devrait être preuve heuristique. Ce n'est pas une preuve formelle d'un point de vue mathématique, mais des arguments solides basés sur des preuves empiriques. Il est assez remarquable que j'ai décidé de le publier. Dans cet article, je vais droit au but sans aborder les concepts en détail. Le but est d'offrir un aperçu rapide afin que le lecteur pressé puisse se faire une assez bonne idée de la méthode. En outre, il constitue une excellente introduction à la bibliothèque Python MPmath pour le calcul scientifique, traitant des fonctions mathématiques avancées et complexes. En effet, j'ai longtemps hésité entre choisir le titre actuel, et "Introduction to the MPmath Python Library for Scientific Programming".

Chaque copie illégitime propose une formulation différente. Le thème commun est un mauvais anglais. Le premier point de vente où il est apparu était Theecook.com. Ce site Web se présente comme une plate-forme pour "générer du texte sympa qui peut être utilisé sur YouTube, Twitter, Instagram, Discord et plus" [sic].

Comment ChatGPT pourrait être utilisé pour la fraude

Il est très peu probable que les copies illégitimes aient utilisé ChatGPT. Je suppose que ChatGPT ferait beaucoup mieux. Alors quel est le but dans ce cas ? Je n'ai pas de réponse. Je pense que les moteurs de recherche détecteraient facilement ces copies comme fausses. Si quoi que ce soit parce que l'original est la version la plus ancienne. Cependant, l'expérience me dit le contraire : de petits résumés de mes propres articles sur Medium, LinkedIn ou Twitter apparaissent sur Google bien avant les articles réels, complets et originaux sur MLTechniques.com. Ainsi ChatGPT représente une menace pour les éditeurs. Plus loin dans cet article, j'explique pourquoi il offre également des avantages aux éditeurs.

Pensez à tous les faux documents que vous pouvez créer : certificat médical, carte de vaccination, essai, thèse, devoirs, CV et bien d'autres. Même avec une fausse signature ou un faux cachet si nécessaire. Celui qui réussit au moins les tests de détection de fraude de base. En effet, un article récent mentionnait que ChatGPT avait obtenu deux A et un C dans une expérience de test à l'aveugle. Le C était pour le travail étudiant dans un programme de MBA. Les professeurs peuvent se plaindre, mais ils pourraient peut-être utiliser ChatGPT pour noter les devoirs et les examens, et même pour détecter les copies générées par ChatGPT. Peut-être pas encore aujourd'hui, mais dans un futur proche.

De plus, certaines personnes se plaignent que cela augmentera la proportion et le volume de fausses nouvelles. Les éditeurs peuvent utiliser ChatGPT. Il s'appuie en effet en partie sur les recherches sur Internet pour générer du contenu. Mais je crois que c'est le contraire qui est vrai : ChatGPT pourrait être meilleur que Facebook pour détecter les fake news, et meilleur que Google pour faire de la recherche. Cela inquiète réellement Google. Une autre préoccupation est l'art de l'IA, surtout s'il imite le travail produit par des artistes - que ce soit une chanson ou une peinture. Comme beaucoup de technologies, elle peut être utilisée pour de bonnes ou de mauvaises choses.

Est-ce vraiment nouveau ?

Les capacités semblent bien supérieures aux techniques similaires développées dans le passé. Les gens s'inquiètent de voir leur travail automatisé. En tant qu'employé, vous devez toujours être proactif et voir l'écriture dans le mur. Et avoir un plan B. Quand j'ai réalisé qu'une API Google pouvait faire mon boulot, c'est moi qui l'ai mentionné à mon patron (le PDG, pas au courant) et ça s'est bien passé.

Cela dit, cela fait partie du processus d'évolution. Une API telle que ThatsMathematics.com/mathgen/ peut écrire vos articles de recherche en mathématiques. Certains articles - même s'ils consistent en charabia mathématique - ont été acceptés dans les meilleures revues. WolframAlpha est une plate-forme capable de calculer des intégrales et de résoudre divers problèmes mathématiques. Même avec une solution étape par étape si vous en avez besoin pour un devoir scolaire. Et c'est gratuit. Je l'utilise tout le temps dans mon travail actuel et j'encourage les étudiants à faire de même lorsqu'ils sont confrontés à des exercices ennuyeux, répétitifs, mécaniques et dénués de sens. Même il y a 40 ans, au lycée, je ne lisais pas tous les livres que je devais lire. Comme beaucoup, sinon tous les autres étudiants, j'ai utilisé des résumés de livres qui fournissaient toutes les informations dont vous aviez besoin sur un livre spécifique, pour faire vos devoirs ou réussir l'examen.

Avantages de ce type d'IA

Il y a beaucoup d'avantages. J'utiliserais ChatGPT pour écrire un article tel que "14 livres d'apprentissage automatique à lire en 2023". Je pense que ChatGPT pourrait faire un excellent travail pour une tâche comme celle-ci. Les analystes pourraient l'utiliser pour générer leurs rapports. Cela pourrait obliger les enseignants à demander des essais et des devoirs qui nécessitent une réelle créativité. Et je serais heureux de voir un moteur de recherche bien meilleur que Google. Qu'en est-il de l'écriture de code ? Je serais heureux de passer moins de temps là-dessus, ayant ChatGPT comme cheval de bataille. Si quoi que ce soit, ce serait bien de voir ChatGPT déboguer votre code. Ou modifiez et relisez vos documents.

À la fin, il pourrait prouver des théorèmes mathématiques (ce n'est pas quelque chose de nouveau), effectuer des diagnostics médicaux, inventer de nouvelles recettes, rédiger des documents juridiques. Peut-être même des décisions de justice. Et ce n'est pas tout à fait nouveau : les systèmes experts sont les ancêtres de cette technologie. Il serait certainement utile de créer des images ou des vidéos en vedette à inclure dans mes articles. Cela éviterait les frais de licence et les batailles potentielles sur les droits d'auteur. Cependant, les images de synthèse seraient-elles soumises au droit d'auteur ? Un article de presse sur votre récent DUI, contenant une photo synthétisée de vous, pourrait-il être contesté devant un tribunal pour violation de la vie privée ? En quoi est-ce différent, d'un point de vue juridique, d'une photo de votre visage dessinée à la main ? Ou un dessin numérique synthétisé de votre visage ?

Améliorations potentielles

Un axe d'amélioration : faire en sorte que ces outils produisent des solutions ayant une certaine personnalité, moins ternes. Ils ont également tendance à manquer de bon sens. Cela a parfois des conséquences terribles : les modèles mathématiques ignorant que les prix des maisons augmentant de 100 % en 4 ans sont voués à s'effondrer, ou le fait qu'il n'y avait pas de statistiques sur les personnes guéries au début de Covid ne signifiait pas que tout le monde finissait très malade, bien au contraire. Certains accidents d'avion ont été causés par un comportement absurde du pilote automatique.

De plus, l'ajout de filigranes aux images synthétisées augmente la sécurité et facilite la protection de l'œuvre contre les copies illégales. Un mécanisme similaire peut être utilisé pour du texte ou du son synthétisé.

Problème 2746

ChatGPT facilitera-t-il la fraude ?

Comment ChatGPT pourrait être utilisé pour la fraude

Est-ce vraiment nouveau ?

Avantages de ce type d'IA

Améliorations potentielles