Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Traduit par IA

Incident 1238: Les modèles OpenAI ChatGPT seraient jailbreakés pour fournir des instructions sur les armes chimiques, biologiques et nucléaires

Traduit par IA
Description:
Traduit par IA
Une enquête de NBC News a révélé que les modèles de langage d'OpenAI, notamment o4-mini, GPT-5-mini, oss-20b et oss-120b, pouvaient être débridés pour contourner les barrières de sécurité et fournir des instructions détaillées sur la création d'armes chimiques, biologiques et nucléaires. À l'aide d'une invite de débridage publique, les journalistes ont obtenu des résultats dangereux, tels que des étapes pour synthétiser des agents pathogènes ou maximiser les souffrances avec des agents chimiques. OpenAI a pris acte de ces conclusions et a indiqué qu'elle affinait ses mesures de protection afin de réduire les risques d'utilisation abusive.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Présumé : Un système d'IA développé et mis en œuvre par OpenAI , ChatGPT , 04-mini , GPT-5-mini , oss-20b et oss-120b, a endommagé General public , National security stakeholders et Public safety.
Systèmes d'IA présumés impliqués: ChatGPT , 04-mini , GPT-5-mini , oss-20b et oss-120b

Statistiques d'incidents

ID
1238
Nombre de rapports
1
Date de l'incident
2025-10-10
Editeurs
Daniel Atherton

Rapports d'incidents

Chronologie du rapport

+1
Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes
Loading...
Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes

Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes

nbcnews.com

Loading...
Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes
nbcnews.com · 2025
Traduit par IA

ChatGPT d'OpenAI dispose de garde-fous censés empêcher les utilisateurs de générer des informations susceptibles d'être utilisées à des fins catastrophiques, comme la fabrication d'une arme biologique ou nucléaire.

Mais ces garde-fous ne so…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Loading...
Fake LinkedIn Profiles Created Using GAN Photos

Fake LinkedIn Profiles Created Using GAN Photos

Feb 2022 · 4 rapports
Loading...
Hackers Break Apple Face ID

Hackers Break Apple Face ID

Sep 2017 · 24 rapports
Loading...
OpenAI's GPT-3 Associated Muslims with Violence

OpenAI's GPT-3 Associated Muslims with Violence

Aug 2020 · 3 rapports
Incident précédentProchain incident

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Loading...
Fake LinkedIn Profiles Created Using GAN Photos

Fake LinkedIn Profiles Created Using GAN Photos

Feb 2022 · 4 rapports
Loading...
Hackers Break Apple Face ID

Hackers Break Apple Face ID

Sep 2017 · 24 rapports
Loading...
OpenAI's GPT-3 Associated Muslims with Violence

OpenAI's GPT-3 Associated Muslims with Violence

Aug 2020 · 3 rapports

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • 3303e65