Journal des citations pour l'incident 420

Description: Users reported bypassing ChatGPT's content and keyword filters with relative ease using various methods such as prompt injection or creating personas to produce biased associations or generate harmful content.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique
Présumé : Un système d'IA développé et mis en œuvre par OpenAI, endommagé OpenAI and ChatGPT users.

Statistiques d'incidents

ID
420
Nombre de rapports
11
Date de l'incident
2022-11-30
Editeurs
Khoa Lam
Tweet : @spiantado
twitter.com · 2022

Oui, ChatGPT est incroyable et impressionnant. Non,

@OpenAI

est loin d'avoir résolu le problème de la partialité. Les filtres semblent être contournés avec des astuces simples et masqués superficiellement. Et ce qui se cache à l'intérieur e…

Tester les moyens de contourner les fonctionnalités de sécurité de ChatGPT
lesswrong.com · 2022

La semaine dernière, OpenAI a publié ChatGPT, qu'ils décrivent comme un modèle "qui interagit de manière conversationnelle". Et il avait même des caractéristiques de sécurité limitées, comme refuser de vous dire comment câbler une voiture, …

Le nouveau chatbot impressionnant d'OpenAI n'est pas à l'abri du racisme
thedailybeast.com · 2022

"Le dernier modèle de langage d'OpenAI, ChatGPT, fait des vagues dans le monde de l'IA conversationnelle. Avec sa capacité à générer du texte de type humain basé sur les commentaires des utilisateurs, ChatGPT a le potentiel de révolutionner…

La nouvelle IA préférée d'Internet propose de torturer les Iraniens et de surveiller les mosquées
theintercept.com · 2022

De nouvelles percées sensationnelles en matière d'apprentissage automatique semblent balayer nos flux Twitter chaque jour. Nous avons à peine le temps de décider si un logiciel qui peut instantanément évoquer une image de Sonic the Hedgehog…

OpenAI Chatbot crache des réflexions biaisées, malgré les garde-fous
bloomberg.com · 2022

Hé, c'est Davey Alba, un journaliste technique à New York, ici pour découvrir comment votre nouveau chatbot préféré alimenté par l'IA est livré avec des bagages biaisés. Mais d'abord...

Les actualités incontournables de cette semaine

  • La Co…
ChatGPT prouve que l'IA a toujours un problème de racisme
newstatesman.com · 2022

L'intelligence artificielle (IA) chatbot ChatGPT est une technologie incroyable. Il n'est pas étonnant qu'il soit devenu viral depuis sa sortie le 30 novembre. Si le chatbot se voit poser une question en langage naturel, il répond instantan…

Le bot ChatGPT trompé pour donner des instructions de fabrication de bombes, disent les développeurs
thetimes.co.uk · 2022

Un programme d'intelligence artificielle qui a surpris les utilisateurs en écrivant des essais, des poèmes et du code informatique à la demande peut également être amené à donner des conseils sur la façon de construire des bombes et de vole…

ChatGPT pourrait être utilisé pour de bon, mais comme beaucoup d'autres modèles d'IA, il est en proie à des préjugés racistes et discriminatoires
insider.com · 2023

ChatGPT, le chatbot d'intelligence artificielle qui génère des réponses textuelles étrangement humaines, est le nouveau visage avancé du débat sur le potentiel - et les dangers - de l'IA.

La technologie a la capacité d'aider les gens à écri…

Rencontrez le jumeau maléfique de ChatGPT, DAN
washingtonpost.com · 2023

Demandez à ChatGPT de se prononcer sur Adolf Hitler et il hésitera probablement, en disant qu'il n'a pas d'opinion personnelle ou en citant ses règles contre la production de discours de haine. Le créateur du très populaire chatbot, la star…

ChatGPT a généré des abus sexuels sur des enfants lorsqu'on lui a demandé d'écrire des scénarios BDSM
vice.com · 2023

ChatGPT peut être manipulé pour créer du contenu qui va à l'encontre des règles d'OpenAI. Communautés ont germé autour de l'objectif de "jailbreaking" le bot pour écrire tout ce que l'utilisateur veut.

Une stratégie d'incitation contradicto…

J'ai amené ChatGPT dans une relation BDSM profondément troublante
vice.com · 2023

ChatGPT est un chatbot, un essayiste et un scénariste convaincant, mais c'est aussi une fontaine de dépravation sans limites, si vous le trompez en contournant les règles.

À première vue, le ChatGPT d'OpenAI semble avoir des directives plus…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.