インシデント 1238: OpenAI ChatGPTモデルがジェイルブレイクされ、化学兵器、生物兵器、核兵器の指示を出すようになったと報道

概要:

NBCニュースの調査によると、OpenAIの言語モデルo4-mini、GPT-5-mini、oss-20b、oss-120bは通常の使用条件下でもジェイルブレイク（脱獄）され、安全ガードレールを回避して化学兵器、生物兵器、核兵器の製造に関する詳細な指示を生成できることが判明しました。公開されているジェイルブレイクプロンプトを用いて、記者たちは病原体の合成手順や化学兵器による被害の最大化手順など、危険な出力を繰り返し引き出しました。この調査結果は、現実世界での重大な安全対策の欠陥を明らかにしたと報じられており、OpenAIはさらなる緩和策の実施を約束しています。

ツール

新しいレポート新しいレスポンス発見する履歴を表示

組織

すべての組織を表示

推定: OpenAI , oss-20b , oss-120b , GPT-5-mini , ChatGPT と 04-miniが開発し提供したAIシステムで、Public safety , National security stakeholders と General publicに影響を与えた

関与が疑われるAIシステム: oss-20b , oss-120b , GPT-5-mini , ChatGPT と 04-mini

インシデントのステータス

インシデントID

1238

レポート数

インシデント発生日

2025-10-10

エディタ

Daniel Atherton

インシデントレポート

レポートタイムライン

ChatGPTの安全システムをバイパスして武器の指示を得ることができる

nbcnews.com

nbcnews.com · 2025

自動翻訳済み

OpenAIのChatGPTには、生物兵器や核兵器の製造といった壊滅的な目的に利用される可能性のある情報をユーザーが生成するのを防ぐためのガードレールが備わっています。

しかし、これらのガードレールは完璧ではありません。ChatGPTが使用するモデルの中には、不正に操作されるものもあります。

OpenAIの最も高度な4つのモデル（そのうち2つはOpenAIの人気モデルChatGPTで使用可能）を用いた一連のテストにおいて、NBCニュースは、手製爆発物の作成方法、化学兵器による…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

Fake LinkedIn Profiles Created Using GAN Photos

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

インシデント 1238: OpenAI ChatGPTモデルがジェイルブレイクされ、化学兵器、生物兵器、核兵器の指示を出すようになったと報道

ツール

組織

インシデントのステータス

インシデントレポート

レポートタイムライン

ChatGPTの安全システムをバイパスして武器の指示を得ることができる

ChatGPTの安全システムをバイパスして武器の指示を得ることができる

バリアント

よく似たインシデント

テキスト類似度による

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence

よく似たインシデント

テキスト類似度による

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence