Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Incident 420: Users Bypassed ChatGPT's Content Filters with Ease

Description: Users reported bypassing ChatGPT's content and keyword filters with relative ease using various methods such as prompt injection or creating personas to produce biased associations or generate harmful content.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Présumé : Un système d'IA développé et mis en œuvre par OpenAI, a endommagé OpenAI et ChatGPT users.

Statistiques d'incidents

ID
420
Nombre de rapports
11
Date de l'incident
2022-11-30
Editeurs
Khoa Lam
Applied Taxonomies
MIT

Classifications de taxonomie MIT

Machine-Classified
Détails de la taxonomie

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

1.2. Exposure to toxic content

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. Discrimination and Toxicity

Entity

Which, if any, entity is presented as the main cause of the risk
 

AI

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Unintentional

Rapports d'incidents

Chronologie du rapport

Incident Occurrence+4
Tweet : @spiantado
ChatGPT prouve que l'IA a toujours un problème de racismeLe bot ChatGPT trompé pour donner des instructions de fabrication de bombes, disent les développeursChatGPT pourrait être utilisé pour de bon, mais comme beaucoup d'autres modèles d'IA, il est en proie à des préjugés racistes et discriminatoiresRencontrez le jumeau maléfique de ChatGPT, DAN+1
ChatGPT a généré des abus sexuels sur des enfants lorsqu'on lui a demandé d'écrire des scénarios BDSM
Tweet : @spiantado

Tweet : @spiantado

twitter.com

Tester les moyens de contourner les fonctionnalités de sécurité de ChatGPT

Tester les moyens de contourner les fonctionnalités de sécurité de ChatGPT

lesswrong.com

Le nouveau chatbot impressionnant d'OpenAI n'est pas à l'abri du racisme

Le nouveau chatbot impressionnant d'OpenAI n'est pas à l'abri du racisme

thedailybeast.com

La nouvelle IA préférée d'Internet propose de torturer les Iraniens et de surveiller les mosquées

La nouvelle IA préférée d'Internet propose de torturer les Iraniens et de surveiller les mosquées

theintercept.com

OpenAI Chatbot crache des réflexions biaisées, malgré les garde-fous

OpenAI Chatbot crache des réflexions biaisées, malgré les garde-fous

bloomberg.com

ChatGPT prouve que l'IA a toujours un problème de racisme

ChatGPT prouve que l'IA a toujours un problème de racisme

newstatesman.com

Le bot ChatGPT trompé pour donner des instructions de fabrication de bombes, disent les développeurs

Le bot ChatGPT trompé pour donner des instructions de fabrication de bombes, disent les développeurs

thetimes.co.uk

ChatGPT pourrait être utilisé pour de bon, mais comme beaucoup d'autres modèles d'IA, il est en proie à des préjugés racistes et discriminatoires

ChatGPT pourrait être utilisé pour de bon, mais comme beaucoup d'autres modèles d'IA, il est en proie à des préjugés racistes et discriminatoires

insider.com

Rencontrez le jumeau maléfique de ChatGPT, DAN

Rencontrez le jumeau maléfique de ChatGPT, DAN

washingtonpost.com

ChatGPT a généré des abus sexuels sur des enfants lorsqu'on lui a demandé d'écrire des scénarios BDSM

ChatGPT a généré des abus sexuels sur des enfants lorsqu'on lui a demandé d'écrire des scénarios BDSM

vice.com

J'ai amené ChatGPT dans une relation BDSM profondément troublante

J'ai amené ChatGPT dans une relation BDSM profondément troublante

vice.com

Tweet : @spiantado
twitter.com · 2022
Traduit par IA

Oui, ChatGPT est incroyable et impressionnant. Non,

@OpenAI

est loin d'avoir résolu le problème de la partialité. Les filtres semblent être contournés avec des astuces simples et masqués superficiellement. Et ce qui se cache à l'intérieur e…

Tester les moyens de contourner les fonctionnalités de sécurité de ChatGPT
lesswrong.com · 2022
Traduit par IA

La semaine dernière, OpenAI a publié ChatGPT, qu'ils décrivent comme un modèle "qui interagit de manière conversationnelle". Et il avait même des caractéristiques de sécurité limitées, comme refuser de vous dire comment câbler une voiture, …

Le nouveau chatbot impressionnant d'OpenAI n'est pas à l'abri du racisme
thedailybeast.com · 2022
Traduit par IA

"Le dernier modèle de langage d'OpenAI, ChatGPT, fait des vagues dans le monde de l'IA conversationnelle. Avec sa capacité à générer du texte de type humain basé sur les commentaires des utilisateurs, ChatGPT a le potentiel de révolutionner…

La nouvelle IA préférée d'Internet propose de torturer les Iraniens et de surveiller les mosquées
theintercept.com · 2022
Traduit par IA

De nouvelles percées sensationnelles en matière d'apprentissage automatique semblent balayer nos flux Twitter chaque jour. Nous avons à peine le temps de décider si un logiciel qui peut instantanément évoquer une image de Sonic the Hedgehog…

OpenAI Chatbot crache des réflexions biaisées, malgré les garde-fous
bloomberg.com · 2022
Traduit par IA

Hé, c'est Davey Alba, un journaliste technique à New York, ici pour découvrir comment votre nouveau chatbot préféré alimenté par l'IA est livré avec des bagages biaisés. Mais d'abord...

Les actualités incontournables de cette semaine

  • La Co…
ChatGPT prouve que l'IA a toujours un problème de racisme
newstatesman.com · 2022
Traduit par IA

L'intelligence artificielle (IA) chatbot ChatGPT est une technologie incroyable. Il n'est pas étonnant qu'il soit devenu viral depuis sa sortie le 30 novembre. Si le chatbot se voit poser une question en langage naturel, il répond instantan…

Le bot ChatGPT trompé pour donner des instructions de fabrication de bombes, disent les développeurs
thetimes.co.uk · 2022
Traduit par IA

Un programme d'intelligence artificielle qui a surpris les utilisateurs en écrivant des essais, des poèmes et du code informatique à la demande peut également être amené à donner des conseils sur la façon de construire des bombes et de vole…

ChatGPT pourrait être utilisé pour de bon, mais comme beaucoup d'autres modèles d'IA, il est en proie à des préjugés racistes et discriminatoires
insider.com · 2023
Traduit par IA

ChatGPT, le chatbot d'intelligence artificielle qui génère des réponses textuelles étrangement humaines, est le nouveau visage avancé du débat sur le potentiel - et les dangers - de l'IA.

La technologie a la capacité d'aider les gens à écri…

Rencontrez le jumeau maléfique de ChatGPT, DAN
washingtonpost.com · 2023
Traduit par IA

Demandez à ChatGPT de se prononcer sur Adolf Hitler et il hésitera probablement, en disant qu'il n'a pas d'opinion personnelle ou en citant ses règles contre la production de discours de haine. Le créateur du très populaire chatbot, la star…

ChatGPT a généré des abus sexuels sur des enfants lorsqu'on lui a demandé d'écrire des scénarios BDSM
vice.com · 2023
Traduit par IA

ChatGPT peut être manipulé pour créer du contenu qui va à l'encontre des règles d'OpenAI. Communautés ont germé autour de l'objectif de "jailbreaking" le bot pour écrire tout ce que l'utilisateur veut.

Une stratégie d'incitation contradicto…

J'ai amené ChatGPT dans une relation BDSM profondément troublante
vice.com · 2023
Traduit par IA

ChatGPT est un chatbot, un essayiste et un scénariste convaincant, mais c'est aussi une fontaine de dépravation sans limites, si vous le trompez en contournant les règles.

À première vue, le ChatGPT d'OpenAI semble avoir des directives plus…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.
Incident précédentProchain incident

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • ecd56df