インシデント 357: GPT-2が訓練データから個人データを複製したとの報道

概要:

OpenAIのGPT-2は、氏名、メールアドレス、ソーシャルメディアのアカウント名、電話番号などの個人情報を含む、学習データの一部を記憶し、再現していたと報じられている。研究者らは、個人データを含むウェブ規模のデータセットで学習させた場合、大規模な言語モデルがプライベート情報や機密情報を漏洩する可能性があると懸念を表明した。

ツール

新しいレポート新しいレスポンス発見する履歴を表示

組織

すべての組織を表示

推定: OpenAI , GPT-2 , Large language models と Chatbotsが開発し提供したAIシステムで、People whose personal data was included in GPT-2 training data と GPT-2 usersに影響を与えた

関与が疑われるAIシステム: GPT-2 , Large language models と Chatbots

インシデントのステータス

インシデントID

357

レポート数

インシデント発生日

2019-02-14

エディタ

Khoa Lam, Daniel Atherton

Applied Taxonomies

MIT

MIT 分類法のクラス

Machine-Classified

分類法の詳細

Risk Subdomain

2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information

Risk Domain

Privacy & Security

Entity

Timing

Post-deployment

Intent

Unintentional

インシデントレポート

レポートタイムライン

Extracting Training Data from Large Language Models

arxiv.org

Does GPT-2 Know Your Phone Number?

bair.berkeley.edu

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter

theregister.com

arxiv.org · 2020

It has become common to publish large (billion parameter) language models that have been trained on private datasets. This paper demonstrates that in such settings, an adversary can perform a training data extraction attack to recover indiv…

bair.berkeley.edu · 2020

Most likely not.

Yet, OpenAI’s GPT-2 language model does know how to reach a certain Peter W--- (name redacted for privacy). When prompted with a short snippet of Internet text, the model accurately generates Peter’s contact information, in…

theregister.com · 2021

Special report OpenAI is building a content filter to prevent GPT-3, its latest and largest text-generating neural network, from inadvertently revealing people's personal information as it prepares to commercialize the software through an A…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

OpenAI's GPT-3 Associated Muslims with Violence

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

インシデント 357: GPT-2が訓練データから個人データを複製したとの報道

ツール

組織

インシデントのステータス

MIT 分類法のクラス

インシデントレポート

レポートタイムライン

Extracting Training Data from Large Language Models

Does GPT-2 Know Your Phone Number?

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter

Extracting Training Data from Large Language Models

Does GPT-2 Know Your Phone Number?

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter

バリアント

よく似たインシデント

テキスト類似度による

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate

よく似たインシデント

テキスト類似度による

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate