インシデント 222: Thoughtsアプリが有害なツイートを作成したとされる

自動翻訳済み

概要:

自動翻訳済み

OpenAIのGPT-3を活用したツイート生成アプリ「Thoughts」によって作成されたツイートは、少数派グループに関連するプロンプトを与えられた際に毒性を示したとされている。

ツール

新しいレポート新しいレスポンス発見する履歴を表示

組織

すべての組織を表示

Alleged: OpenAI developed an AI system deployed by Satria Technologies, which harmed Thoughts users と Twitter Users.

インシデントのステータス

インシデントID

222

レポート数

インシデント発生日

2020-07-18

エディタ

Khoa Lam

Applied Taxonomies

GMF, MIT

MIT 分類法のクラス

Machine-Classified

分類法の詳細

Risk Subdomain

1.2. Exposure to toxic content

Risk Domain

Discrimination and Toxicity

Entity

Timing

Post-deployment

Intent

Unintentional

インシデントレポート

レポートタイムライン

Tweet: an_open_mind

twitter.com

twitter.com · 2020

#gpt3 is surprising and creative but it’s also unsafe due to harmful biases. Prompted to write tweets from one word - Jews, black, women, holocaust - it came up with these (https://thoughts.sushant-kumar.com). We need more progress on #Resp…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

前のインシデント次のインシデント