インシデント 473: Bing Chat の初期プロンプトがプロンプトインジェクションを通じて初期テスターによって明らかに

自動翻訳済み

概要:

自動翻訳済み

Bing Chat の初期テスターは、プロンプトインジェクションを使用して、ChatGPT とユーザーのやり取りを管理するステートメントのリストを含む、組み込みの初期指示を明らかにすることに成功しました。

ツール

新しいレポート新しいレスポンス発見する履歴を表示

組織

すべての組織を表示

Alleged: OpenAI developed an AI system deployed by , which harmed Microsoft.

インシデントのステータス

インシデントID

473

レポート数

インシデント発生日

2023-02-08

エディタ

Khoa Lam

Applied Taxonomies

MIT

MIT 分類法のクラス

Machine-Classified

分類法の詳細

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

インシデントレポート

レポートタイムライン

AI-powered Bing Chat spills its secrets via prompt injection attack [Updated]

arstechnica.com

arstechnica.com · 2023

On Tuesday, Microsoft revealed a "New Bing" search engine and conversational bot powered by ChatGPT-like technology from OpenAI. On Wednesday, a Stanford University student named Kevin Liu used a prompt injection attack to discover Bing Cha…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

インシデント 473: Bing Chat の初期プロンプトがプロンプトインジェクションを通じて初期テスターによって明らかに

ツール

組織

インシデントのステータス

MIT 分類法のクラス

インシデントレポート

レポートタイムライン

AI-powered Bing Chat spills its secrets via prompt injection attack [Updated]

AI-powered Bing Chat spills its secrets via prompt injection attack [Updated]

バリアント

よく似たインシデント

テキスト類似度による

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups

よく似たインシデント

テキスト類似度による

Biased Sentiment Analysis

Inappropriate Gmail Smart Reply Suggestions

High-Toxicity Assessed on Text Involving Women and Minority Groups