インシデント 85の引用情報

Description: On September 8, 2020, the Guardian published an op-ed generated by OpenAI’s GPT-3 text generating AI that included threats to destroy humankind. This incident has been downgraded to an issue as it does not meet current ingestion criteria.
推定: OpenAIが開発し提供したAIシステムで、unknownに影響を与えた

インシデントのステータス

インシデントID
85
レポート数
1
インシデント発生日
2020-10-09
エディタ
Sean McGregor

CSETv1 分類法のクラス

分類法の詳細

CSETv0 分類法のクラス

分類法の詳細

Full Description

On September 8, 2020, the Guardian published an op-ed generated by OpenAI’s GPT-3 text generator. The editors prompted GPT-3 to write an op-ed on about “why humans have nothing to fear from AI,” but some passages in the resulting output took a threatening tone, including “I know that I will not be able to avoid destroying humankind.” In a note the editors add that they used GPT-3 to generate eight different responses and the human editors spliced them together to create a compelling piece.

Short Description

On September 8, 2020, the Guardian published an op-ed generated by OpenAI’s GPT-3 text generating AI that included threats to destroy humankind.

Severity

Negligible

Harm Type

Psychological harm

AI System Description

OpenAI's GPT-3 neural-network-powered language generator.

System Developer

OpenAI

Sector of Deployment

Education

Relevant AI functions

Cognition, Action

AI Techniques

Unsupervised learning, Deep neural network

AI Applications

language generation

Location

United Kingdom

Named Entities

The Guardian, GPT-3, OpenAI

Technology Purveyor

The Guardian, OpenAI

Beginning Date

2020-09-08T07:00:00.000Z

Ending Date

2020-09-08T07:00:00.000Z

Near Miss

Unclear/unknown

Intent

Unclear

Lives Lost

No

Data Inputs

Unlabeled text drawn from web scraping

インシデントレポート

レポートタイムライン

AI Incident Database Incidents Converted to Issues
github.com · 2022

The following former incidents have been converted to "issues" following an update to the incident definition and ingestion criteria.

21: Tougher Turing Test Exposes Chatbots’ Stupidity

Description: The 2016 Winograd Schema Challenge highli…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents