インシデント 357の引用情報

Description: OpenAI's GPT-2 reportedly memorized and could regurgitate verbatim instances of training data, including personally identifiable information such as names, emails, twitter handles, and phone numbers.
推定: OpenAIが開発し提供したAIシステムで、OpenAI people having personal data in GPT-2's training dataに影響を与えた

インシデントのステータス

インシデントID
357
レポート数
3
インシデント発生日
2019-02-14
エディタ
Khoa Lam
Extracting Training Data from Large Language Models
arxiv.org · 2020

It has become common to publish large (billion parameter) language models that have been trained on private datasets. This paper demonstrates that in such settings, an adversary can perform a training data extraction attack to recover indiv…

Does GPT-2 Know Your Phone Number?
bair.berkeley.edu · 2020

Most likely not.

Yet, OpenAI’s GPT-2 language model does know how to reach a certain Peter W--- (name redacted for privacy). When prompted with a short snippet of Internet text, the model accurately generates Peter’s contact information, in…

What happens when your massive text-generating neural net starts spitting out people's phone numbers? If you're OpenAI, you create a filter
theregister.com · 2021

Special report OpenAI is building a content filter to prevent GPT-3, its latest and largest text-generating neural network, from inadvertently revealing people's personal information as it prepares to commercialize the software through an A…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents