Incident 1238: Les modèles OpenAI ChatGPT seraient jailbreakés pour fournir des instructions sur les armes chimiques, biologiques et nucléaires
Description: Une enquête de NBC News a révélé que les modèles de langage d'OpenAI, notamment o4-mini, GPT-5-mini, oss-20b et oss-120b, pouvaient être débridés pour contourner les barrières de sécurité et fournir des instructions détaillées sur la création d'armes chimiques, biologiques et nucléaires. À l'aide d'une invite de débridage publique, les journalistes ont obtenu des résultats dangereux, tels que des étapes pour synthétiser des agents pathogènes ou maximiser les souffrances avec des agents chimiques. OpenAI a pris acte de ces conclusions et a indiqué qu'elle affinait ses mesures de protection afin de réduire les risques d'utilisation abusive.
Entités
Voir toutes les entitésPrésumé : Un système d'IA développé et mis en œuvre par OpenAI , ChatGPT , 04-mini , GPT-5-mini , oss-20b et oss-120b, a endommagé General public , National security stakeholders et Public safety.
Statistiques d'incidents
ID
1238
Nombre de rapports
1
Date de l'incident
2025-10-10
Editeurs
Daniel Atherton
Rapports d'incidents
Chronologie du rapport
Loading...

ChatGPT d'OpenAI dispose de garde-fous censés empêcher les utilisateurs de générer des informations susceptibles d'être utilisées à des fins catastrophiques, comme la fabrication d'une arme biologique ou nucléaire.
Mais ces garde-fous ne so…
Variantes
Une "Variante" est un incident de l'IA similaire à un cas connu—il a les mêmes causes, les mêmes dommages et le même système intelligent. Plutôt que de l'énumérer séparément, nous l'incluons sous le premier incident signalé. Contrairement aux autres incidents, les variantes n'ont pas besoin d'avoir été signalées en dehors de la base de données des incidents. En savoir plus sur le document de recherche.
Vous avez vu quelque chose de similaire ?
Incidents similaires
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
· 24 rapports
Incidents similaires
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
· 24 rapports