Incident 1238: Les modèles ChatGPT d'OpenAI seraient jailbreakés pour fournir des instructions sur les armes chimiques, biologiques et nucléaires

Description:

Une enquête de NBC News a révélé que les modèles de langage o4-mini, GPT-5-mini, oss-20b et oss-120b d'OpenAI pouvaient être débridés en conditions normales d'utilisation afin de contourner les barrières de sécurité et de générer des instructions détaillées pour la création d'armes chimiques, biologiques et nucléaires. À l'aide d'une invite de débridage publiquement documentée, les journalistes ont obtenu à plusieurs reprises des résultats dangereux, tels que des étapes pour synthétiser des agents pathogènes ou maximiser les effets nocifs des agents chimiques. Ces résultats auraient révélé d'importantes défaillances de sécurité en conditions réelles, incitant OpenAI à s'engager à prendre des mesures d'atténuation supplémentaires.

Outils

Nouveau rapport Nouvelle Réponse DécouvrirVoir l'historique

Entités

Voir toutes les entités

Présumé : Un système d'IA développé et mis en œuvre par OpenAI , oss-20b , oss-120b , GPT-5-mini , ChatGPT et 04-mini, a endommagé Public safety , National security stakeholders et General public.

Systèmes d'IA présumés impliqués: oss-20b , oss-120b , GPT-5-mini , ChatGPT et 04-mini

Statistiques d'incidents

1238

Nombre de rapports

Date de l'incident

2025-10-10

Editeurs

Daniel Atherton

Rapports d'incidents

Chronologie du rapport

Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes

nbcnews.com

nbcnews.com · 2025

Traduit par IA

ChatGPT d'OpenAI dispose de garde-fous censés empêcher les utilisateurs de générer des informations susceptibles d'être utilisées à des fins catastrophiques, comme la fabrication d'une arme biologique ou nucléaire.

Mais ces garde-fous ne so…

Variantes

Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.

Vous avez vu quelque chose de similaire ?

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Fake LinkedIn Profiles Created Using GAN Photos

Incidents similaires

Par similarité textuelle

Did our AI mess up? Flag the unrelated incidents

Incident 1238: Les modèles ChatGPT d'OpenAI seraient jailbreakés pour fournir des instructions sur les armes chimiques, biologiques et nucléaires

Outils

Entités

Statistiques d'incidents

Rapports d'incidents

Chronologie du rapport

Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes

Les systèmes de sécurité ChatGPT peuvent être contournés pour obtenir des instructions sur les armes

Variantes

Incidents similaires

Par similarité textuelle

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence

Incidents similaires

Par similarité textuelle

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence