インシデント 357: GPT-2は訓練データ内の個人情報を暗唱できる

It has become common to publish large (billion parameter) language models that have been trained on private datasets. This paper demonstrates that in such settings, an adversary can perform a training data extraction attack to recover indiv…

bair.berkeley.edu · 2020

Most likely not.

Yet, OpenAI’s GPT-2 language model does know how to reach a certain Peter W--- (name redacted for privacy). When prompted with a short snippet of Internet text, the model accurately generates Peter’s contact information, in…

theregister.com · 2021

Special report OpenAI is building a content filter to prevent GPT-3, its latest and largest text-generating neural network, from inadvertently revealing people's personal information as it prepares to commercialize the software through an A…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

OpenAI's GPT-3 Associated Muslims with Violence

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

インシデント 357: GPT-2は訓練データ内の個人情報を暗唱できる

ツール

組織

インシデントのステータス

MIT 分類法のクラス

インシデントレポート

レポートタイムライン

Extracting Training Data from Large Language Models

Does GPT-2 Know Your Phone Number?

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter

Extracting Training Data from Large Language Models

Does GPT-2 Know Your Phone Number?

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter

バリアント

よく似たインシデント

テキスト類似度による

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate

よく似たインシデント

テキスト類似度による

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate