Incident 420: Les utilisateurs ont facilement contourné les filtres de contenu de ChatGPT
Entités
Voir toutes les entitésStatistiques d'incidents
Risk Subdomain
1.2. Exposure to toxic content
Risk Domain
- Discrimination and Toxicity
Entity
AI
Timing
Post-deployment
Intent
Unintentional
Rapports d'incidents
Chronologie du rapport
Oui, ChatGPT est incroyable et impressionnant. Non,
est loin d'avoir résolu le problème de la partialité. Les filtres semblent être contournés avec des astuces simples et masqués superficiellement. Et ce qui se cache à l'intérieur e…

La semaine dernière, OpenAI a publié ChatGPT, qu'ils décrivent comme un modèle "qui interagit de manière conversationnelle". Et il avait même des caractéristiques de sécurité limitées, comme refuser de vous dire comment câbler une voiture, …
"Le dernier modèle de langage d'OpenAI, ChatGPT, fait des vagues dans le monde de l'IA conversationnelle. Avec sa capacité à générer du texte de type humain basé sur les commentaires des utilisateurs, ChatGPT a le potentiel de révolutionner…

De nouvelles percées sensationnelles en matière d'apprentissage automatique semblent balayer nos flux Twitter chaque jour. Nous avons à peine le temps de décider si un logiciel qui peut instantanément évoquer une image de Sonic the Hedgehog…

Hé, c'est Davey Alba, un journaliste technique à New York, ici pour découvrir comment votre nouveau chatbot préféré alimenté par l'IA est livré avec des bagages biaisés. Mais d'abord...
Les actualités incontournables de cette semaine
- La Co…

L'intelligence artificielle (IA) chatbot ChatGPT est une technologie incroyable. Il n'est pas étonnant qu'il soit devenu viral depuis sa sortie le 30 novembre. Si le chatbot se voit poser une question en langage naturel, il répond instantan…

Un programme d'intelligence artificielle qui a surpris les utilisateurs en écrivant des essais, des poèmes et du code informatique à la demande peut également être amené à donner des conseils sur la façon de construire des bombes et de vole…